一種基于多分支網(wǎng)絡(luò)結(jié)構(gòu)加速翻譯模型訓(xùn)練速度的方法
基本信息
申請(qǐng)?zhí)?/td> | CN202110637196.5 | 申請(qǐng)日 | - |
公開(kāi)(公告)號(hào) | CN113392655A | 公開(kāi)(公告)日 | 2021-09-14 |
申請(qǐng)公布號(hào) | CN113392655A | 申請(qǐng)公布日 | 2021-09-14 |
分類號(hào) | G06F40/58(2020.01)I;G06F40/289(2020.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 杜權(quán);劉興宇;徐萍 | 申請(qǐng)(專利權(quán))人 | 沈陽(yáng)雅譯網(wǎng)絡(luò)技術(shù)有限公司 |
代理機(jī)構(gòu) | 沈陽(yáng)新科知識(shí)產(chǎn)權(quán)代理事務(wù)所(特殊普通合伙) | 代理人 | 李曉光 |
地址 | 110004遼寧省沈陽(yáng)市和平區(qū)三好街78號(hào)東軟電腦城C座11層 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明涉及一種基于多分支網(wǎng)絡(luò)結(jié)構(gòu)加速翻譯模型訓(xùn)練速度的方法,步驟為:清洗來(lái)自公開(kāi)數(shù)據(jù)集的訓(xùn)練數(shù)據(jù),去除數(shù)據(jù)中包含亂碼的句子,分別對(duì)雙語(yǔ)數(shù)據(jù)進(jìn)行分詞、去重和平行語(yǔ)料的長(zhǎng)度比過(guò)濾,得到可靠的雙語(yǔ)數(shù)據(jù);修改開(kāi)源的翻譯模型結(jié)構(gòu),構(gòu)建新的多分支翻譯模型;使用與翻譯模型不同的訓(xùn)練策略對(duì)多分支翻譯模型進(jìn)行訓(xùn)練;用戶向模型輸入源文,多分支翻譯模型使用束搜索進(jìn)行模型推斷,生成用戶輸入源文的譯文。本發(fā)明更加有效地學(xué)習(xí)語(yǔ)料知識(shí),在能保證模型性能的條件下,具有更快的訓(xùn)練速度,一定程度上緩解了傳統(tǒng)模型訓(xùn)練較慢的缺陷,將多分支網(wǎng)絡(luò)結(jié)構(gòu)成功地運(yùn)用在了神經(jīng)機(jī)器翻譯中,完備了多分支網(wǎng)絡(luò)在神經(jīng)機(jī)器翻譯中的應(yīng)用。 |
