一種突發(fā)事件檢測方法及裝置
基本信息
申請?zhí)?/td> | CN202111120270.2 | 申請日 | - |
公開(公告)號 | CN113836267A | 公開(公告)日 | 2021-12-24 |
申請公布號 | CN113836267A | 申請公布日 | 2021-12-24 |
分類號 | G06F16/33(2019.01)I;G06F16/335(2019.01)I;G06F16/35(2019.01)I;G06F40/284(2020.01)I | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 張君維;豐蘇;馬志遠(yuǎn);李靜;王歡;王慶春;于大東;郭爽 | 申請(專利權(quán))人 | 國家市場監(jiān)督管理總局信息中心 |
代理機(jī)構(gòu) | 北京集佳知識產(chǎn)權(quán)代理有限公司 | 代理人 | 劉樂 |
地址 | 100088北京市海淀區(qū)馬甸東路9號 | ||
法律狀態(tài) | - |
摘要
摘要 | 本申請公開了一種突發(fā)事件檢測方法及裝置,方法包括:對新聞數(shù)據(jù)集進(jìn)行第一處理,得到預(yù)處理數(shù)據(jù)集和對應(yīng)的詞頻數(shù)據(jù)集,預(yù)處理器數(shù)據(jù)集中包含多個實詞詞語,詞頻數(shù)據(jù)集中包含實詞詞語的出現(xiàn)次數(shù);基于預(yù)處理數(shù)據(jù)集、詞頻數(shù)據(jù)集以及實詞詞語所屬新聞的展示信息確定各個實詞詞語的突發(fā)性,并將突發(fā)性滿足第一條件的實詞詞語確定為突發(fā)詞;對多個突發(fā)詞組成的突發(fā)詞集進(jìn)行基于詞語共現(xiàn)性的相似度計算,構(gòu)建所述多個突發(fā)詞之間的相似度矩陣;對相似度矩陣進(jìn)行聚類處理,并基于聚類結(jié)果確定突發(fā)事件。上述實現(xiàn)方案將新聞數(shù)據(jù)特征與詞語自身特征結(jié)合來計算突發(fā)性,能夠有效提高提取突發(fā)詞的準(zhǔn)確度,從而整體上提升突發(fā)事件檢測結(jié)果的準(zhǔn)確性。 |
