一種基于輔助表示融合的非自回歸神經(jīng)機(jī)器翻譯方法

基本信息

申請?zhí)?/td> CN202110592517.4 申請日 -
公開(公告)號 CN113378584A 公開(公告)日 2021-09-10
申請公布號 CN113378584A 申請公布日 2021-09-10
分類號 G06F40/58(2020.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I 分類 計算;推算;計數(shù);
發(fā)明人 杜權(quán);劉興宇 申請(專利權(quán))人 沈陽雅譯網(wǎng)絡(luò)技術(shù)有限公司
代理機(jī)構(gòu) 沈陽新科知識產(chǎn)權(quán)代理事務(wù)所(特殊普通合伙) 代理人 李曉光
地址 110004遼寧省沈陽市和平區(qū)三好街78號東軟電腦城C座11層
法律狀態(tài) -

摘要

摘要 本發(fā)明公開一種基于輔助表示融合的非自回歸神經(jīng)機(jī)器翻譯方法,步驟為:構(gòu)造自回歸神經(jīng)機(jī)器翻譯模型;構(gòu)建訓(xùn)練平行語料,訓(xùn)練一個只有一層解碼器的模型;構(gòu)造非自回歸神經(jīng)機(jī)器翻譯模型;將自回歸神經(jīng)機(jī)器翻譯模型解碼器最頂層的前饋神經(jīng)網(wǎng)絡(luò)后的輸出與非自回歸神經(jīng)機(jī)器翻譯模型編碼器的頂層表示進(jìn)行加權(quán)融合,作為非自回歸神經(jīng)機(jī)器翻譯模型解碼器的輸入;編碼器提取源語句子信息,解碼器根據(jù)該源語句子信息來預(yù)測對應(yīng)的目標(biāo)語句子;完成非自回歸神經(jīng)機(jī)器翻譯模型的訓(xùn)練;將源語句子送入非自回歸神經(jīng)機(jī)器翻譯模型中,解碼出不同長度的翻譯結(jié)果。本發(fā)明結(jié)合自回歸模型和非自回歸模型的優(yōu)點,在損失了較小性能的情況下,能夠獲得7~9倍的速度提升。