一種用于文本摘要的生成方法和系統(tǒng)
基本信息
申請?zhí)?/td> | CN201910926161.6 | 申請日 | - |
公開(公告)號 | CN110705287A | 公開(公告)日 | 2020-01-17 |
申請公布號 | CN110705287A | 申請公布日 | 2020-01-17 |
分類號 | G06F40/289;G06F40/30;G06N3/08;G06N3/04 | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 吳家鳴;李敏 | 申請(專利權)人 | 北京妙筆智能科技有限公司 |
代理機構 | 廈門福貝知識產權代理事務所(普通合伙) | 代理人 | 北京妙筆智能科技有限公司 |
地址 | 100015 北京市朝陽區(qū)酒仙橋北路9號(廠區(qū))10幢二層A5-12 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明給出了一種用于文本摘要的生成方法和系統(tǒng),包括對待處理文本進行預處理,其中,預處理包括去除待處理文本的html標簽;基于TF?IDF統(tǒng)計方法,獲取待處理文本中文本單元的權重;利用ilp算法計算、submodular算法和centroid算法分別計算獲得待處理文本的第一文本摘要、第二文本摘要和第三文本摘要;基于深度卷積網(wǎng)絡學習模型,獲取待處理文本的第四文本摘要;響應于文本單元中含有預先建立的摘要詞庫中的詞匯,獲取第五文本摘要;將第一文本摘要、第二文本摘要、第三文本摘要、第四文本摘要和第五文本摘要進行加權計算,獲取待處理文本的文本摘要。本發(fā)明在實際應用中,對文本摘要的獲取取得了非常好的效果,準確率非常高。 |
