專利雙語句對加工方法及系統(tǒng)
基本信息
申請?zhí)?/td> | CN201911064809.X | 申請日 | - |
公開(公告)號 | CN110807337B | 公開(公告)日 | 2021-11-12 |
申請公布號 | CN110807337B | 申請公布日 | 2021-11-12 |
分類號 | G06F40/58(2020.01)I;G06F40/242(2020.01)I;G06F40/166(2020.01)I;G06F40/137(2020.01)I;G06F40/131(2020.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 張孝飛;張遷;馬偉;李帥;馬毓昭 | 申請(專利權(quán))人 | 北京中獻(xiàn)電子技術(shù)開發(fā)有限公司 |
代理機(jī)構(gòu) | 中科專利商標(biāo)代理有限責(zé)任公司 | 代理人 | 鄢功軍 |
地址 | 100081北京市海淀區(qū)氣象路50號中知大廈 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明涉及機(jī)器翻譯技術(shù)領(lǐng)域,尤其涉及一種專利雙語句對加工方法及系統(tǒng);所述方法包括以下步驟:獲取專利篇章級雙語對齊語料;提取專利雙語篇章級文章的內(nèi)容特征;根據(jù)內(nèi)容特征,對雙語對齊篇章級語料進(jìn)行內(nèi)容模塊的切分并分級處理;根據(jù)內(nèi)容分級模塊結(jié)果進(jìn)行段落模塊切分;對不同段落模塊進(jìn)行分類整理;根據(jù)段落模塊的分類整理結(jié)果,進(jìn)行句子級對齊的分類整理。本發(fā)明所公開的專利雙語句對加工方法及系統(tǒng),在統(tǒng)計(jì)翻譯的基礎(chǔ)上,從專利領(lǐng)域出發(fā),在對專利文獻(xiàn)分析的基礎(chǔ)上,形成專利知識庫,再結(jié)合神經(jīng)網(wǎng)絡(luò)翻譯,實(shí)現(xiàn)了專利雙語句對庫的自動抽取和生成,極大的提高了效率和準(zhǔn)確率,有利于快速建立專利領(lǐng)域雙語句對語料庫。 |
