基于翻譯記憶庫的機器翻譯方法及裝置

基本信息

申請?zhí)?/td> CN202110203208.3 申請日 -
公開(公告)號 CN112818712A 公開(公告)日 2021-05-18
申請公布號 CN112818712A 申請公布日 2021-05-18
分類號 G06F40/58;G06F40/289 分類 計算;推算;計數(shù);
發(fā)明人 毛紅保 申請(專利權(quán))人 語聯(lián)網(wǎng)(武漢)信息技術(shù)有限公司
代理機構(gòu) 北京路浩知識產(chǎn)權(quán)代理有限公司 代理人 聶俊偉
地址 430206 湖北省武漢市東湖新技術(shù)開發(fā)區(qū)高新大道999號未來科技城B2棟13樓1302室
法律狀態(tài) -

摘要

摘要 本發(fā)明提供一種基于翻譯記憶庫的機器翻譯方法,該方法包括:從翻譯記憶庫中查找與待翻譯原文相似度最高的語料原文和語料原文的譯文;將待翻譯原文和語料原文進行比較,獲取語料原文中與待翻譯原文不同的差異部分;將差異部分映射到語料原文的譯文,將語料原文的譯文中差異部分映射的譯文替換為掩碼;將替換后的語料原文的譯文和待翻譯原文作為機器翻譯模型的輸入,輸出待翻譯原文的譯文;其中,機器翻譯模型由翻譯原文樣本作為樣本,翻譯原文樣本對應(yīng)的譯文作為標(biāo)簽進行訓(xùn)練獲得。本發(fā)明實現(xiàn)聯(lián)合待翻譯原文和語料原文的譯文進行翻譯,不僅可以提高翻譯效率,降低翻譯成本,還可以提高翻譯的準(zhǔn)確性。