一種基于輔助表示融合的非自回歸神經(jīng)機(jī)器翻譯方法
基本信息
申請?zhí)?/td> | CN202110592517.4 | 申請日 | - |
公開(公告)號 | CN113378584A | 公開(公告)日 | 2021-09-10 |
申請公布號 | CN113378584A | 申請公布日 | 2021-09-10 |
分類號 | G06F40/58(2020.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 杜權(quán);劉興宇 | 申請(專利權(quán))人 | 沈陽雅譯網(wǎng)絡(luò)技術(shù)有限公司 |
代理機(jī)構(gòu) | 沈陽新科知識產(chǎn)權(quán)代理事務(wù)所(特殊普通合伙) | 代理人 | 李曉光 |
地址 | 110004遼寧省沈陽市和平區(qū)三好街78號東軟電腦城C座11層 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開一種基于輔助表示融合的非自回歸神經(jīng)機(jī)器翻譯方法,步驟為:構(gòu)造自回歸神經(jīng)機(jī)器翻譯模型;構(gòu)建訓(xùn)練平行語料,訓(xùn)練一個只有一層解碼器的模型;構(gòu)造非自回歸神經(jīng)機(jī)器翻譯模型;將自回歸神經(jīng)機(jī)器翻譯模型解碼器最頂層的前饋神經(jīng)網(wǎng)絡(luò)后的輸出與非自回歸神經(jīng)機(jī)器翻譯模型編碼器的頂層表示進(jìn)行加權(quán)融合,作為非自回歸神經(jīng)機(jī)器翻譯模型解碼器的輸入;編碼器提取源語句子信息,解碼器根據(jù)該源語句子信息來預(yù)測對應(yīng)的目標(biāo)語句子;完成非自回歸神經(jīng)機(jī)器翻譯模型的訓(xùn)練;將源語句子送入非自回歸神經(jīng)機(jī)器翻譯模型中,解碼出不同長度的翻譯結(jié)果。本發(fā)明結(jié)合自回歸模型和非自回歸模型的優(yōu)點,在損失了較小性能的情況下,能夠獲得7~9倍的速度提升。 |
