一種翻譯模型的訓(xùn)練方法及裝置、翻譯方法及裝置
基本信息
申請?zhí)?/td> | CN202010215046.0 | 申請日 | - |
公開(公告)號 | CN113449529A | 公開(公告)日 | 2021-09-28 |
申請公布號 | CN113449529A | 申請公布日 | 2021-09-28 |
分類號 | G06F40/58(2020.01)I;G06F40/289(2020.01)I;G06F40/284(2020.01)I;G06F40/205(2020.01)I | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 李長亮;郭馨澤 | 申請(專利權(quán))人 | 成都金山互動娛樂科技有限公司 |
代理機構(gòu) | 北京智信禾專利代理有限公司 | 代理人 | 王治東 |
地址 | 100085北京市海淀區(qū)小營西路33號金山軟件大廈2層西區(qū) | ||
法律狀態(tài) | - |
摘要
摘要 | 本申請?zhí)峁┮环N翻譯模型的訓(xùn)練方法及裝置、翻譯方法及裝置,翻譯模型包括:編碼器和語言模型,語言模型采用目標語言的單語語料預(yù)訓(xùn)練得到;訓(xùn)練方法包括:將源語言樣本語句輸入至編碼器,得到與源語言樣本語句對應(yīng)的第一編碼向量;將與源語言樣本語句對應(yīng)的第一編碼向量和目標語言樣本語句輸入至語言模型,得到語言模型輸出的第一解碼向量以及第一解碼向量對應(yīng)的誤差;基于第一解碼向量對應(yīng)的誤差調(diào)整語言模型和編碼器的參數(shù),直至達到訓(xùn)練停止條件,從而有效解決在雙語語料資源稀缺的情況下導(dǎo)致翻譯模型訓(xùn)練不充分,進而獲得的翻譯結(jié)果質(zhì)量低下的問題,使翻譯模型在低資源翻譯任務(wù)下有更好的表現(xiàn),進一步的,提高了翻譯結(jié)果的質(zhì)量。 |
