一種基于有機物命名實體的機器翻譯方法及翻譯系統(tǒng)

基本信息

申請?zhí)?/td> CN201410451887.6 申請日 -
公開(公告)號 CN104298662B 公開(公告)日 2017-10-10
申請公布號 CN104298662B 申請公布日 2017-10-10
分類號 G06F17/28(2006.01)I 分類 計算;推算;計數(shù);
發(fā)明人 任智軍;張威;李進;楊婧;張延花 申請(專利權)人 中國專利信息中心
代理機構 北京瑞恒信達知識產權代理事務所(普通合伙) 代理人 中國專利信息中心
地址 100088 北京市海淀區(qū)薊門橋西土城路6號
法律狀態(tài) -

摘要

摘要 本發(fā)明提供了一種基于有機物命名實體的機器翻譯方法和系統(tǒng),首先對翻譯文本全文進行分析,獲得初始分詞和詞性標注信息;識別有機物命名實體,用NEOC標簽標注有機物命名實體的起始位置,在此基礎上重新分詞并進行詞性標注,對識別出的有機物命名實體詞性標注為NP;翻譯有機物命名實體,并在有機物命名實體譯文庫中保存所述的有機物命名實體及對應的翻譯結果;對翻譯文本全文以句為單位進行翻譯。使用本發(fā)明提高了有機物命名實體的識別率,提高了出現(xiàn)有機物的語句的句法分析和翻譯的準確性,同時,多次出現(xiàn)的有機物命名實體只進行一次翻譯,提高了系統(tǒng)的翻譯速度和準確性。