跨語言自動摘要生成方法、裝置、計算機設(shè)備及存儲介質(zhì)
基本信息
申請?zhí)?/td> | CN202011642808.1 | 申請日 | - |
公開(公告)號 | CN112711661A | 公開(公告)日 | 2021-04-27 |
申請公布號 | CN112711661A | 申請公布日 | 2021-04-27 |
分類號 | G06F16/34;G06F40/58;G06F40/126;G06F40/216;G06F40/189;G06N3/04 | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 李文祿 | 申請(專利權(quán))人 | 華潤數(shù)字科技(西安)有限公司 |
代理機構(gòu) | 深圳市精英專利事務(wù)所 | 代理人 | 武志峰 |
地址 | 710000 陜西省西安市高新區(qū)天谷八路211號環(huán)普科技產(chǎn)業(yè)園C座303、304室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了跨語言自動摘要生成方法、裝置、計算機設(shè)備及存儲介質(zhì),該方法包括:獲取待生成摘要的雙語文本,并對所述雙語文本進行預(yù)處理得到文本數(shù)據(jù)集;基于卷積神經(jīng)網(wǎng)絡(luò)和循環(huán)神經(jīng)網(wǎng)絡(luò)對所述文本數(shù)據(jù)集中的上下文信息進行全局編碼,得到所述文本數(shù)據(jù)集的概要狀態(tài)序列;利用多層Transformer網(wǎng)絡(luò)對所述概要狀態(tài)序列進行解碼,并利用自注意力機制對解碼后的結(jié)果進行計算,然后將得到的計算結(jié)果作為候選文本摘要;通過集束搜索對所述候選文本摘要進行約束,從而對所述候選文本摘要中的語句進行評分,并從評分后的候選文本摘要中選擇評分最高的語句作為最終的摘要文本。本發(fā)明可以有效提高對于跨語言文本的摘要生成準確度以及摘要生成效率。 |
