一種用于網(wǎng)絡文章的摘要自動提取方法

基本信息

申請?zhí)?/td> CN201810894746.X 申請日 -
公開(公告)號 CN109255022B 公開(公告)日 2021-11-23
申請公布號 CN109255022B 申請公布日 2021-11-23
分類號 G06F16/34(2019.01)I;G06F40/258(2020.01)I;G06F40/211(2020.01)I;G06F40/289(2020.01)I 分類 計算;推算;計數(shù);
發(fā)明人 鄢軍;袁傳義;徐光杰;林建波 申請(專利權)人 優(yōu)賽恒創(chuàng)科技發(fā)展(北京)有限公司
代理機構 上海衡方知識產(chǎn)權代理有限公司 代理人 朱穆峰
地址 100022北京市朝陽區(qū)建國路91號院9號樓10層1018室
法律狀態(tài) -

摘要

摘要 本發(fā)明記載了一種用于網(wǎng)絡文章的摘要自動提取方法,包括:獲取文章;設置摘要長度;提取關鍵詞,并獲取關鍵詞的權重和詞性;對獲得的關鍵詞進行漢語詞性標注;獲取關鍵詞列表Tags;獲取標題關鍵詞列表和正文關鍵詞列表;獲取相同的關鍵詞列表;加權平均;分段處理;獲取詞的命中個數(shù)和權重累計值;得到最終的摘要等步驟。由于采用了上述步驟,本發(fā)明可以將網(wǎng)絡抓取的文章自動獲取摘要后存儲在數(shù)據(jù)庫中,為后面的檢索和顯示提供了基本的保證,并具備了思路簡單有效、實現(xiàn)方式簡單等有益效果,最終在確保提取準確率的同時實現(xiàn)了簡潔高效,從而可以在有限的時間里高效、高質量處理海量網(wǎng)絡文章。