語(yǔ)言處理方法及裝置、語(yǔ)言處理系統(tǒng)的訓(xùn)練方法及裝置

基本信息

申請(qǐng)?zhí)?/td> CN201910867015.0 申請(qǐng)日 -
公開(公告)號(hào) CN110598222A 公開(公告)日 2019-12-20
申請(qǐng)公布號(hào) CN110598222A 申請(qǐng)公布日 2019-12-20
分類號(hào) G06F17/28(2006.01); G06N3/08(2006.01) 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 徐智濤; 唐劍波; 李長(zhǎng)亮; 郭馨澤 申請(qǐng)(專利權(quán))人 成都金山數(shù)字娛樂(lè)科技有限公司
代理機(jī)構(gòu) 北京智信禾專利代理有限公司 代理人 北京金山數(shù)字娛樂(lè)科技有限公司; 成都金山數(shù)字娛樂(lè)科技有限公司
地址 100085 北京市海淀區(qū)小營(yíng)西路33號(hào)金山軟件大廈2層西區(qū)
法律狀態(tài) -

摘要

摘要 本申請(qǐng)?zhí)峁┝苏Z(yǔ)言處理方法及裝置、語(yǔ)言處理系統(tǒng)的訓(xùn)練方法及裝置,其中,所述語(yǔ)言處理方法包括:將包括多個(gè)待翻譯語(yǔ)句的目標(biāo)段落輸入翻譯模型,得到每個(gè)待翻譯語(yǔ)句對(duì)應(yīng)的翻譯語(yǔ)句;將包含連接詞的翻譯語(yǔ)句中的連接詞替換為連接標(biāo)記,將不包含連接詞的翻譯語(yǔ)句中插入連接標(biāo)記,生成每個(gè)翻譯語(yǔ)句對(duì)應(yīng)的標(biāo)記翻譯語(yǔ)句;將多個(gè)標(biāo)記翻譯語(yǔ)句輸入已訓(xùn)練好的語(yǔ)言模型,語(yǔ)言模型將連接標(biāo)記刪除或替換為對(duì)應(yīng)的最終連接詞,得到每個(gè)標(biāo)記翻譯語(yǔ)句對(duì)應(yīng)的最終翻譯語(yǔ)句,根據(jù)每個(gè)標(biāo)記翻譯語(yǔ)句對(duì)應(yīng)的最終翻譯語(yǔ)句拼接得到翻譯段落,從而使段落的翻譯結(jié)果的語(yǔ)義表達(dá)更加流暢,實(shí)現(xiàn)了目標(biāo)任務(wù)語(yǔ)言處理的有效提升。