一種基于翻譯記憶庫的神經(jīng)機(jī)器翻譯方法

基本信息

申請(qǐng)?zhí)?/td> CN202110661294.2 申請(qǐng)日 -
公開(公告)號(hào) CN113343717A 公開(公告)日 2021-09-03
申請(qǐng)公布號(hào) CN113343717A 申請(qǐng)公布日 2021-09-03
分類號(hào) G06F40/58(2020.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 杜權(quán);楊迪 申請(qǐng)(專利權(quán))人 沈陽雅譯網(wǎng)絡(luò)技術(shù)有限公司
代理機(jī)構(gòu) 沈陽新科知識(shí)產(chǎn)權(quán)代理事務(wù)所(特殊普通合伙) 代理人 李曉光
地址 110004遼寧省沈陽市和平區(qū)三好街78號(hào)東軟電腦城C座11層
法律狀態(tài) -

摘要

摘要 本發(fā)明公開一種基于翻譯記憶庫的神經(jīng)機(jī)器翻譯方法,步驟為:從含有外文數(shù)據(jù)的網(wǎng)絡(luò)中爬取海量雙語數(shù)據(jù);對(duì)雙語數(shù)據(jù)進(jìn)行預(yù)處理,得到處理后的雙語數(shù)據(jù);將一半雙語數(shù)據(jù)存儲(chǔ)為翻譯記憶庫基礎(chǔ)數(shù)據(jù),另一半使用搜索技術(shù)找到翻譯記憶庫中與訓(xùn)練語料中每個(gè)句子最相似的句子;將訓(xùn)練語料數(shù)據(jù)和翻譯記憶庫數(shù)據(jù)一起輸入到神經(jīng)網(wǎng)絡(luò)模型中開始訓(xùn)練模型;導(dǎo)入用戶自定義的數(shù)據(jù)到翻譯記憶庫中;對(duì)用戶實(shí)時(shí)輸入的文本搜索找到翻譯記憶庫中與該文本最相似的句子,輸入到機(jī)器翻譯模型中,在解碼端使用門控機(jī)制指導(dǎo)模型翻譯;將用戶輸入的句子和修訂后的結(jié)果存入翻譯記憶庫。本發(fā)明應(yīng)用先進(jìn)的神經(jīng)機(jī)器翻譯技術(shù),翻譯效果優(yōu)越,滿足不同用戶對(duì)翻譯譯文的高質(zhì)量要求。