一種突發(fā)事件檢測方法及裝置

基本信息

申請?zhí)?/td> CN202111120270.2 申請日 -
公開(公告)號 CN113836267A 公開(公告)日 2021-12-24
申請公布號 CN113836267A 申請公布日 2021-12-24
分類號 G06F16/33(2019.01)I;G06F16/335(2019.01)I;G06F16/35(2019.01)I;G06F40/284(2020.01)I 分類 計算;推算;計數(shù);
發(fā)明人 張君維;豐蘇;馬志遠(yuǎn);李靜;王歡;王慶春;于大東;郭爽 申請(專利權(quán))人 國家市場監(jiān)督管理總局信息中心
代理機(jī)構(gòu) 北京集佳知識產(chǎn)權(quán)代理有限公司 代理人 劉樂
地址 100088北京市海淀區(qū)馬甸東路9號
法律狀態(tài) -

摘要

摘要 本申請公開了一種突發(fā)事件檢測方法及裝置,方法包括:對新聞數(shù)據(jù)集進(jìn)行第一處理,得到預(yù)處理數(shù)據(jù)集和對應(yīng)的詞頻數(shù)據(jù)集,預(yù)處理器數(shù)據(jù)集中包含多個實詞詞語,詞頻數(shù)據(jù)集中包含實詞詞語的出現(xiàn)次數(shù);基于預(yù)處理數(shù)據(jù)集、詞頻數(shù)據(jù)集以及實詞詞語所屬新聞的展示信息確定各個實詞詞語的突發(fā)性,并將突發(fā)性滿足第一條件的實詞詞語確定為突發(fā)詞;對多個突發(fā)詞組成的突發(fā)詞集進(jìn)行基于詞語共現(xiàn)性的相似度計算,構(gòu)建所述多個突發(fā)詞之間的相似度矩陣;對相似度矩陣進(jìn)行聚類處理,并基于聚類結(jié)果確定突發(fā)事件。上述實現(xiàn)方案將新聞數(shù)據(jù)特征與詞語自身特征結(jié)合來計算突發(fā)性,能夠有效提高提取突發(fā)詞的準(zhǔn)確度,從而整體上提升突發(fā)事件檢測結(jié)果的準(zhǔn)確性。