一種用于網(wǎng)絡文章的摘要自動提取方法
基本信息
申請?zhí)?/td> | CN201810894746.X | 申請日 | - |
公開(公告)號 | CN109255022B | 公開(公告)日 | 2021-11-23 |
申請公布號 | CN109255022B | 申請公布日 | 2021-11-23 |
分類號 | G06F16/34(2019.01)I;G06F40/258(2020.01)I;G06F40/211(2020.01)I;G06F40/289(2020.01)I | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 鄢軍;袁傳義;徐光杰;林建波 | 申請(專利權)人 | 優(yōu)賽恒創(chuàng)科技發(fā)展(北京)有限公司 |
代理機構 | 上海衡方知識產(chǎn)權代理有限公司 | 代理人 | 朱穆峰 |
地址 | 100022北京市朝陽區(qū)建國路91號院9號樓10層1018室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明記載了一種用于網(wǎng)絡文章的摘要自動提取方法,包括:獲取文章;設置摘要長度;提取關鍵詞,并獲取關鍵詞的權重和詞性;對獲得的關鍵詞進行漢語詞性標注;獲取關鍵詞列表Tags;獲取標題關鍵詞列表和正文關鍵詞列表;獲取相同的關鍵詞列表;加權平均;分段處理;獲取詞的命中個數(shù)和權重累計值;得到最終的摘要等步驟。由于采用了上述步驟,本發(fā)明可以將網(wǎng)絡抓取的文章自動獲取摘要后存儲在數(shù)據(jù)庫中,為后面的檢索和顯示提供了基本的保證,并具備了思路簡單有效、實現(xiàn)方式簡單等有益效果,最終在確保提取準確率的同時實現(xiàn)了簡潔高效,從而可以在有限的時間里高效、高質量處理海量網(wǎng)絡文章。 |
