一種熱點新聞發(fā)現(xiàn)系統(tǒng)及方法
基本信息
申請?zhí)?/td> | CN202111040356.4 | 申請日 | - |
公開(公告)號 | CN113705231A | 公開(公告)日 | 2021-11-26 |
申請公布號 | CN113705231A | 申請公布日 | 2021-11-26 |
分類號 | G06F40/289(2020.01)I;G06F40/211(2020.01)I;G06K9/62(2006.01)I;G06F16/951(2019.01)I;G06F16/35(2019.01)I | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 王歡;朱善偉;馬云騰;余強 | 申請(專利權(quán))人 | 北京清博智能科技有限公司 |
代理機構(gòu) | - | 代理人 | - |
地址 | 100095北京市海淀區(qū)花園路5號133幢13層1301 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種熱點新聞發(fā)現(xiàn)系統(tǒng)及方法,發(fā)現(xiàn)系統(tǒng)包括數(shù)據(jù)采集模塊、數(shù)據(jù)分析模塊、數(shù)據(jù)展示模塊,數(shù)據(jù)分析模塊包括數(shù)據(jù)加工清洗單元、數(shù)據(jù)存儲單元、數(shù)據(jù)去重單元、路徑計算單元、熱點新聞計算單元;發(fā)現(xiàn)方法包括以下步驟:步驟一:對全網(wǎng)輿情數(shù)據(jù)進行采集;步驟二:對采集到的全網(wǎng)輿情數(shù)據(jù)進行預處理;步驟三:對預處理后的數(shù)據(jù)進行存儲;步驟四:對預處理后的數(shù)據(jù)進行去重處理;步驟五:對去重處理后的數(shù)據(jù)進行傳播路徑計算;步驟六:對傳播路徑計算后的數(shù)據(jù)進行熱度值統(tǒng)計,并分析出熱點新聞。本發(fā)明通過自然語言處理技術(shù)對新聞文本進行聚類,存儲和獲取熱點事件及其傳播途徑,可有效智能的自動發(fā)現(xiàn)熱點新聞。 |
