一種基于深度學(xué)習(xí)的文本摘要方法及系統(tǒng)
基本信息
申請(qǐng)?zhí)?/td> | CN202111439109.1 | 申請(qǐng)日 | - |
公開(kāi)(公告)號(hào) | CN114385806A | 公開(kāi)(公告)日 | 2022-04-22 |
申請(qǐng)公布號(hào) | CN114385806A | 申請(qǐng)公布日 | 2022-04-22 |
分類號(hào) | G06F16/34(2019.01)I;G06F40/211(2020.01)I;G06F40/289(2020.01)I;G06F40/30(2020.01)I;G06F16/35(2019.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 徐書(shū)豪;王亞平;賴新明;王志剛;林文輝;伺彥偉;祁洪波 | 申請(qǐng)(專利權(quán))人 | 河北航天信息技術(shù)有限公司 |
代理機(jī)構(gòu) | 北京工信聯(lián)合知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | 劉海蓉 |
地址 | 100195北京市海淀區(qū)杏石口路甲18號(hào) | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明實(shí)施例公開(kāi)了一種基于深度學(xué)習(xí)的文本摘要方法及系統(tǒng),其中方法包括:對(duì)目標(biāo)文件進(jìn)行中文分詞和句子分割處理,將目標(biāo)文件的原始文本劃分為單獨(dú)的句子;將劃分為單獨(dú)句子的原始文本轉(zhuǎn)換為文本向量;對(duì)文本向量進(jìn)行自注意力計(jì)算,得到包含語(yǔ)義信息的句子特征;對(duì)通過(guò)亂序的自注意力計(jì)算得到的各個(gè)句子特征進(jìn)行加權(quán)整合,并對(duì)加權(quán)整合后的句子特征進(jìn)行歸一化處理,得到篇章級(jí)的句子特征;將篇章級(jí)的句子特征輸入預(yù)先構(gòu)建的分類模型,輸出句子類別;根據(jù)句子類別將目標(biāo)文件的原始文本劃分為關(guān)鍵信息和非關(guān)鍵信息兩部分;將關(guān)鍵信息按照合理的順序進(jìn)行排列組織,并將排列組織后的關(guān)鍵信息合成語(yǔ)義通順、語(yǔ)法合規(guī)的摘要文本。 |
