基于翻譯記憶庫的機(jī)器翻譯方法及裝置

基本信息

申請(qǐng)?zhí)?/td> CN202110203208.3 申請(qǐng)日 -
公開(公告)號(hào) CN112818712A 公開(公告)日 2021-05-18
申請(qǐng)公布號(hào) CN112818712A 申請(qǐng)公布日 2021-05-18
分類號(hào) G06F40/58;G06F40/289 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 毛紅保 申請(qǐng)(專利權(quán))人 語聯(lián)網(wǎng)(武漢)信息技術(shù)有限公司
代理機(jī)構(gòu) 北京路浩知識(shí)產(chǎn)權(quán)代理有限公司 代理人 聶俊偉
地址 430206 湖北省武漢市東湖新技術(shù)開發(fā)區(qū)高新大道999號(hào)未來科技城B2棟13樓1302室
法律狀態(tài) -

摘要

摘要 本發(fā)明提供一種基于翻譯記憶庫的機(jī)器翻譯方法,該方法包括:從翻譯記憶庫中查找與待翻譯原文相似度最高的語料原文和語料原文的譯文;將待翻譯原文和語料原文進(jìn)行比較,獲取語料原文中與待翻譯原文不同的差異部分;將差異部分映射到語料原文的譯文,將語料原文的譯文中差異部分映射的譯文替換為掩碼;將替換后的語料原文的譯文和待翻譯原文作為機(jī)器翻譯模型的輸入,輸出待翻譯原文的譯文;其中,機(jī)器翻譯模型由翻譯原文樣本作為樣本,翻譯原文樣本對(duì)應(yīng)的譯文作為標(biāo)簽進(jìn)行訓(xùn)練獲得。本發(fā)明實(shí)現(xiàn)聯(lián)合待翻譯原文和語料原文的譯文進(jìn)行翻譯,不僅可以提高翻譯效率,降低翻譯成本,還可以提高翻譯的準(zhǔn)確性。