一種翻譯模型的訓(xùn)練方法及裝置、翻譯方法及裝置

基本信息

申請?zhí)?/td> CN202010215046.0 申請日 -
公開(公告)號 CN113449529A 公開(公告)日 2021-09-28
申請公布號 CN113449529A 申請公布日 2021-09-28
分類號 G06F40/58(2020.01)I;G06F40/289(2020.01)I;G06F40/284(2020.01)I;G06F40/205(2020.01)I 分類 計算;推算;計數(shù);
發(fā)明人 李長亮;郭馨澤 申請(專利權(quán))人 成都金山互動娛樂科技有限公司
代理機構(gòu) 北京智信禾專利代理有限公司 代理人 王治東
地址 100085北京市海淀區(qū)小營西路33號金山軟件大廈2層西區(qū)
法律狀態(tài) -

摘要

摘要 本申請?zhí)峁┮环N翻譯模型的訓(xùn)練方法及裝置、翻譯方法及裝置,翻譯模型包括:編碼器和語言模型,語言模型采用目標語言的單語語料預(yù)訓(xùn)練得到;訓(xùn)練方法包括:將源語言樣本語句輸入至編碼器,得到與源語言樣本語句對應(yīng)的第一編碼向量;將與源語言樣本語句對應(yīng)的第一編碼向量和目標語言樣本語句輸入至語言模型,得到語言模型輸出的第一解碼向量以及第一解碼向量對應(yīng)的誤差;基于第一解碼向量對應(yīng)的誤差調(diào)整語言模型和編碼器的參數(shù),直至達到訓(xùn)練停止條件,從而有效解決在雙語語料資源稀缺的情況下導(dǎo)致翻譯模型訓(xùn)練不充分,進而獲得的翻譯結(jié)果質(zhì)量低下的問題,使翻譯模型在低資源翻譯任務(wù)下有更好的表現(xiàn),進一步的,提高了翻譯結(jié)果的質(zhì)量。