一種基于有機(jī)物命名實(shí)體的機(jī)器翻譯方法及翻譯系統(tǒng)

基本信息

申請(qǐng)?zhí)?/td> CN201410451887.6 申請(qǐng)日 -
公開(公告)號(hào) CN104298662A 公開(公告)日 2015-01-21
申請(qǐng)公布號(hào) CN104298662A 申請(qǐng)公布日 2015-01-21
分類號(hào) G06F17/28(2006.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 任智軍;張威;李進(jìn);楊婧;張延花 申請(qǐng)(專利權(quán))人 中國(guó)專利信息中心
代理機(jī)構(gòu) 北京瑞恒信達(dá)知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 中國(guó)專利信息中心
地址 100088 北京市海淀區(qū)薊門橋西土城路6號(hào)
法律狀態(tài) -

摘要

摘要 本發(fā)明提供了一種基于有機(jī)物命名實(shí)體的機(jī)器翻譯方法和系統(tǒng),首先對(duì)翻譯文本全文進(jìn)行分析,獲得初始分詞和詞性標(biāo)注信息;識(shí)別有機(jī)物命名實(shí)體,用NEOC標(biāo)簽標(biāo)注有機(jī)物命名實(shí)體的起始位置,在此基礎(chǔ)上重新分詞并進(jìn)行詞性標(biāo)注,對(duì)識(shí)別出的有機(jī)物命名實(shí)體詞性標(biāo)注為NP;翻譯有機(jī)物命名實(shí)體,并在有機(jī)物命名實(shí)體譯文庫中保存所述的有機(jī)物命名實(shí)體及對(duì)應(yīng)的翻譯結(jié)果;對(duì)翻譯文本全文以句為單位進(jìn)行翻譯。使用本發(fā)明提高了有機(jī)物命名實(shí)體的識(shí)別率,提高了出現(xiàn)有機(jī)物的語句的句法分析和翻譯的準(zhǔn)確性,同時(shí),多次出現(xiàn)的有機(jī)物命名實(shí)體只進(jìn)行一次翻譯,提高了系統(tǒng)的翻譯速度和準(zhǔn)確性。