一種基于解碼器輸入增強(qiáng)的非自回歸神經(jīng)機(jī)器翻譯方法
基本信息
申請?zhí)?/td> | CN202110592520.6 | 申請日 | - |
公開(公告)號 | CN113468895A | 公開(公告)日 | 2021-10-01 |
申請公布號 | CN113468895A | 申請公布日 | 2021-10-01 |
分類號 | G06F40/58(2020.01)I;G06K9/62(2006.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 杜權(quán);徐萍;楊迪 | 申請(專利權(quán))人 | 沈陽雅譯網(wǎng)絡(luò)技術(shù)有限公司 |
代理機(jī)構(gòu) | 沈陽新科知識產(chǎn)權(quán)代理事務(wù)所(特殊普通合伙) | 代理人 | 李曉光 |
地址 | 110004遼寧省沈陽市和平區(qū)三好街78號東軟電腦城C座11層 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開一種基于解碼器輸入增強(qiáng)的非自回歸神經(jīng)機(jī)器翻譯方法,步驟為:構(gòu)造非自回歸神經(jīng)機(jī)器翻譯模型;構(gòu)建雙語混合預(yù)訓(xùn)練模型;將雙語混合句子作為編碼器的輸入,通過解碼器來預(yù)測編碼器中被替換的片段;用雙語混合預(yù)訓(xùn)練模型編碼器的詞嵌入初始化非自回歸神經(jīng)機(jī)器翻譯模型編碼器和解碼器的詞嵌入;構(gòu)建訓(xùn)練平行語料,生成機(jī)器翻譯詞表;通過解碼器預(yù)測對應(yīng)的目標(biāo)語句子;計算預(yù)測出的分布與真實數(shù)據(jù)分布的差異,完成非自回歸神經(jīng)機(jī)器翻譯模型的訓(xùn)練過程;將源語句子送入非自回歸神經(jīng)機(jī)器翻譯模型中。本發(fā)明通過詞典替換的方式將源語與目標(biāo)語的表示映射到了同一的詞義空間下,豐富了詞向量的表達(dá)能力,可被非自回歸神經(jīng)機(jī)器翻譯模型更好利用。 |
