一種基于翻譯記憶庫的神經(jīng)機(jī)器翻譯方法
基本信息
申請(qǐng)?zhí)?/td> | CN202110661294.2 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN113343717A | 公開(公告)日 | 2021-09-03 |
申請(qǐng)公布號(hào) | CN113343717A | 申請(qǐng)公布日 | 2021-09-03 |
分類號(hào) | G06F40/58(2020.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 杜權(quán);楊迪 | 申請(qǐng)(專利權(quán))人 | 沈陽雅譯網(wǎng)絡(luò)技術(shù)有限公司 |
代理機(jī)構(gòu) | 沈陽新科知識(shí)產(chǎn)權(quán)代理事務(wù)所(特殊普通合伙) | 代理人 | 李曉光 |
地址 | 110004遼寧省沈陽市和平區(qū)三好街78號(hào)東軟電腦城C座11層 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開一種基于翻譯記憶庫的神經(jīng)機(jī)器翻譯方法,步驟為:從含有外文數(shù)據(jù)的網(wǎng)絡(luò)中爬取海量雙語數(shù)據(jù);對(duì)雙語數(shù)據(jù)進(jìn)行預(yù)處理,得到處理后的雙語數(shù)據(jù);將一半雙語數(shù)據(jù)存儲(chǔ)為翻譯記憶庫基礎(chǔ)數(shù)據(jù),另一半使用搜索技術(shù)找到翻譯記憶庫中與訓(xùn)練語料中每個(gè)句子最相似的句子;將訓(xùn)練語料數(shù)據(jù)和翻譯記憶庫數(shù)據(jù)一起輸入到神經(jīng)網(wǎng)絡(luò)模型中開始訓(xùn)練模型;導(dǎo)入用戶自定義的數(shù)據(jù)到翻譯記憶庫中;對(duì)用戶實(shí)時(shí)輸入的文本搜索找到翻譯記憶庫中與該文本最相似的句子,輸入到機(jī)器翻譯模型中,在解碼端使用門控機(jī)制指導(dǎo)模型翻譯;將用戶輸入的句子和修訂后的結(jié)果存入翻譯記憶庫。本發(fā)明應(yīng)用先進(jìn)的神經(jīng)機(jī)器翻譯技術(shù),翻譯效果優(yōu)越,滿足不同用戶對(duì)翻譯譯文的高質(zhì)量要求。 |
