一種熱點信息挖掘方法、裝置、計算機設備及存儲介質(zhì)

基本信息

申請?zhí)?/td> CN202110169266.9 申請日 -
公開(公告)號 CN112836110A 公開(公告)日 2021-05-25
申請公布號 CN112836110A 申請公布日 2021-05-25
分類號 G06F16/951;G06F16/953;G06F16/906;G06K9/62 分類 計算;推算;計數(shù);
發(fā)明人 高登科;徐楨虎;李少博;陳涵宇;余偉 申請(專利權(quán))人 四川封面?zhèn)髅接邢挢熑喂?/a>
代理機構(gòu) 成都頂峰專利事務所(普通合伙) 代理人 楊國瑞
地址 610000 四川省成都市錦江區(qū)紅星路二段70號1棟8樓A區(qū)
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及數(shù)據(jù)挖掘技術(shù)領(lǐng)域,公開了一種熱點信息挖掘方法、裝置、計算機設備及存儲介質(zhì),可以只從網(wǎng)絡公開數(shù)據(jù)出發(fā),實時爬取多源熱榜話題及新聞信息,并利用不良審核和深度去重技術(shù)進行新聞信息的篩查和過濾,最終采用熱點融合實現(xiàn)熱點話題發(fā)現(xiàn),構(gòu)建熱點話題新聞庫,從而不僅使挖掘結(jié)果具有精度高的特點,還可以大大縮減挖掘過程所依賴的數(shù)據(jù)量,并具有高可信度、高時效性和非不良性的魯棒性,能夠很好滿足真實場景的應用。此外,還可以針對全網(wǎng)實時新聞,通過從文本、圖片和視頻等多個維度進行新聞與熱點話題的多模態(tài)匹配,并根據(jù)匹配結(jié)果直接豐富熱點話題新聞庫,可大大提高熱點話題下新聞庫的庫量級和多樣性。