專利雙語句對加工方法及系統(tǒng)

基本信息

申請?zhí)?/td> CN201911064809.X 申請日 -
公開(公告)號 CN110807337B 公開(公告)日 2021-11-12
申請公布號 CN110807337B 申請公布日 2021-11-12
分類號 G06F40/58(2020.01)I;G06F40/242(2020.01)I;G06F40/166(2020.01)I;G06F40/137(2020.01)I;G06F40/131(2020.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 張孝飛;張遷;馬偉;李帥;馬毓昭 申請(專利權(quán))人 北京中獻(xiàn)電子技術(shù)開發(fā)有限公司
代理機(jī)構(gòu) 中科專利商標(biāo)代理有限責(zé)任公司 代理人 鄢功軍
地址 100081北京市海淀區(qū)氣象路50號中知大廈
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及機(jī)器翻譯技術(shù)領(lǐng)域,尤其涉及一種專利雙語句對加工方法及系統(tǒng);所述方法包括以下步驟:獲取專利篇章級雙語對齊語料;提取專利雙語篇章級文章的內(nèi)容特征;根據(jù)內(nèi)容特征,對雙語對齊篇章級語料進(jìn)行內(nèi)容模塊的切分并分級處理;根據(jù)內(nèi)容分級模塊結(jié)果進(jìn)行段落模塊切分;對不同段落模塊進(jìn)行分類整理;根據(jù)段落模塊的分類整理結(jié)果,進(jìn)行句子級對齊的分類整理。本發(fā)明所公開的專利雙語句對加工方法及系統(tǒng),在統(tǒng)計(jì)翻譯的基礎(chǔ)上,從專利領(lǐng)域出發(fā),在對專利文獻(xiàn)分析的基礎(chǔ)上,形成專利知識庫,再結(jié)合神經(jīng)網(wǎng)絡(luò)翻譯,實(shí)現(xiàn)了專利雙語句對庫的自動抽取和生成,極大的提高了效率和準(zhǔn)確率,有利于快速建立專利領(lǐng)域雙語句對語料庫。