一種文本摘要生成方法和裝置

基本信息

申請?zhí)?/td> CN201711281994.9 申請日 -
公開(公告)號 CN108304445B 公開(公告)日 2021-08-03
申請公布號 CN108304445B 申請公布日 2021-08-03
分類號 G06F16/34(2019.01)I;G06F40/211(2020.01)I;G06K9/62(2006.01)I 分類 計算;推算;計數(shù);
發(fā)明人 李想 申請(專利權(quán))人 新華網(wǎng)股份有限公司
代理機構(gòu) 北京集佳知識產(chǎn)權(quán)代理有限公司 代理人 王寶筠
地址 100031北京市西城區(qū)宣武門西大街129號金隅大廈708
法律狀態(tài) -

摘要

摘要 本申請?zhí)峁┮环N文本摘要生成方法和裝置。方法包括:將待提取摘要的文本文檔中的各個段落進行合并,得到目標文本文檔;按照預(yù)設(shè)的第一切分方法,對目標文本文檔進行切分,得到句子集合,所述句子集合包括多個句子;計算句子集合中兩兩句子之間的相似度;基于句子集合中兩兩句子之間的相似度,得到所述句子集合中每個句子相對于所述句子集合中的其他句子的相似度權(quán)重;按照相似度權(quán)重由大到小的順序?qū)λ鼍渥蛹现械木渥舆M行排序;基于排序的前N個句子,生成所述文本文檔的文本摘要。本申請在兼顧文本處理速度性能的同時,提高了文本摘要生成的準確性。