一種基于深度學(xué)習(xí)的文本摘要方法及系統(tǒng)

基本信息

申請(qǐng)?zhí)?/td> CN202111439109.1 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN114385806A 公開(kāi)(公告)日 2022-04-22
申請(qǐng)公布號(hào) CN114385806A 申請(qǐng)公布日 2022-04-22
分類號(hào) G06F16/34(2019.01)I;G06F40/211(2020.01)I;G06F40/289(2020.01)I;G06F40/30(2020.01)I;G06F16/35(2019.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 徐書(shū)豪;王亞平;賴新明;王志剛;林文輝;伺彥偉;祁洪波 申請(qǐng)(專利權(quán))人 河北航天信息技術(shù)有限公司
代理機(jī)構(gòu) 北京工信聯(lián)合知識(shí)產(chǎn)權(quán)代理有限公司 代理人 劉海蓉
地址 100195北京市海淀區(qū)杏石口路甲18號(hào)
法律狀態(tài) -

摘要

摘要 本發(fā)明實(shí)施例公開(kāi)了一種基于深度學(xué)習(xí)的文本摘要方法及系統(tǒng),其中方法包括:對(duì)目標(biāo)文件進(jìn)行中文分詞和句子分割處理,將目標(biāo)文件的原始文本劃分為單獨(dú)的句子;將劃分為單獨(dú)句子的原始文本轉(zhuǎn)換為文本向量;對(duì)文本向量進(jìn)行自注意力計(jì)算,得到包含語(yǔ)義信息的句子特征;對(duì)通過(guò)亂序的自注意力計(jì)算得到的各個(gè)句子特征進(jìn)行加權(quán)整合,并對(duì)加權(quán)整合后的句子特征進(jìn)行歸一化處理,得到篇章級(jí)的句子特征;將篇章級(jí)的句子特征輸入預(yù)先構(gòu)建的分類模型,輸出句子類別;根據(jù)句子類別將目標(biāo)文件的原始文本劃分為關(guān)鍵信息和非關(guān)鍵信息兩部分;將關(guān)鍵信息按照合理的順序進(jìn)行排列組織,并將排列組織后的關(guān)鍵信息合成語(yǔ)義通順、語(yǔ)法合規(guī)的摘要文本。