一種適用于神經(jīng)網(wǎng)絡(luò)機器翻譯的漢語分詞方法及裝置

基本信息

申請?zhí)?/td> CN201911028104.2 申請日 -
公開(公告)號 CN110852099A 公開(公告)日 2020-02-28
申請公布號 CN110852099A 申請公布日 2020-02-28
分類號 G06F40/289;G06F40/216;G06F40/58 分類 計算;推算;計數(shù);
發(fā)明人 張孝飛;葛昱暉;陳莉莉;李帥;呂榮波 申請(專利權(quán))人 北京中獻(xiàn)電子技術(shù)開發(fā)有限公司
代理機構(gòu) 中科專利商標(biāo)代理有限責(zé)任公司 代理人 鄢功軍
地址 100081 北京市海淀區(qū)氣象路50號中知大廈
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及機器翻譯技術(shù)領(lǐng)域,尤其涉及一種適用于神經(jīng)網(wǎng)絡(luò)機器翻譯的漢語分詞方法及裝置;所述分詞方法包括以下步驟:S100:對傳統(tǒng)分詞詞表進(jìn)行處理,形成適用于神經(jīng)網(wǎng)絡(luò)機器翻譯的新分詞詞表;S200:依照新分詞詞表,對句子進(jìn)行分詞,采用前向最大匹配法和后向最大匹配法結(jié)合的方式,分別進(jìn)行分詞;S300:將前向最大匹配法的分詞結(jié)果和后向最大匹配法的分詞結(jié)果進(jìn)行比較,進(jìn)行評價處理后擇一輸出,該方法降低了待譯文本的數(shù)據(jù)維度,提高了神經(jīng)網(wǎng)絡(luò)機器翻譯的效率和準(zhǔn)確性。