一種熱點新聞發(fā)現(xiàn)系統(tǒng)及方法

基本信息

申請?zhí)?/td> CN202111040356.4 申請日 -
公開(公告)號 CN113705231A 公開(公告)日 2021-11-26
申請公布號 CN113705231A 申請公布日 2021-11-26
分類號 G06F40/289(2020.01)I;G06F40/211(2020.01)I;G06K9/62(2006.01)I;G06F16/951(2019.01)I;G06F16/35(2019.01)I 分類 計算;推算;計數(shù);
發(fā)明人 王歡;朱善偉;馬云騰;余強 申請(專利權(quán))人 北京清博智能科技有限公司
代理機構(gòu) - 代理人 -
地址 100095北京市海淀區(qū)花園路5號133幢13層1301
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種熱點新聞發(fā)現(xiàn)系統(tǒng)及方法,發(fā)現(xiàn)系統(tǒng)包括數(shù)據(jù)采集模塊、數(shù)據(jù)分析模塊、數(shù)據(jù)展示模塊,數(shù)據(jù)分析模塊包括數(shù)據(jù)加工清洗單元、數(shù)據(jù)存儲單元、數(shù)據(jù)去重單元、路徑計算單元、熱點新聞計算單元;發(fā)現(xiàn)方法包括以下步驟:步驟一:對全網(wǎng)輿情數(shù)據(jù)進行采集;步驟二:對采集到的全網(wǎng)輿情數(shù)據(jù)進行預處理;步驟三:對預處理后的數(shù)據(jù)進行存儲;步驟四:對預處理后的數(shù)據(jù)進行去重處理;步驟五:對去重處理后的數(shù)據(jù)進行傳播路徑計算;步驟六:對傳播路徑計算后的數(shù)據(jù)進行熱度值統(tǒng)計,并分析出熱點新聞。本發(fā)明通過自然語言處理技術(shù)對新聞文本進行聚類,存儲和獲取熱點事件及其傳播途徑,可有效智能的自動發(fā)現(xiàn)熱點新聞。