一種突發(fā)事件檢測方法及裝置
基本信息
申請?zhí)?/td> | CN202111120270.2 | 申請日 | - |
公開(公告)號(hào) | CN113836267A | 公開(公告)日 | 2021-12-24 |
申請公布號(hào) | CN113836267A | 申請公布日 | 2021-12-24 |
分類號(hào) | G06F16/33(2019.01)I;G06F16/335(2019.01)I;G06F16/35(2019.01)I;G06F40/284(2020.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 張君維;豐蘇;馬志遠(yuǎn);李靜;王歡;王慶春;于大東;郭爽 | 申請(專利權(quán))人 | 國家市場監(jiān)督管理總局信息中心 |
代理機(jī)構(gòu) | 北京集佳知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | 劉樂 |
地址 | 100088北京市海淀區(qū)馬甸東路9號(hào) | ||
法律狀態(tài) | - |
摘要
摘要 | 本申請公開了一種突發(fā)事件檢測方法及裝置,方法包括:對新聞數(shù)據(jù)集進(jìn)行第一處理,得到預(yù)處理數(shù)據(jù)集和對應(yīng)的詞頻數(shù)據(jù)集,預(yù)處理器數(shù)據(jù)集中包含多個(gè)實(shí)詞詞語,詞頻數(shù)據(jù)集中包含實(shí)詞詞語的出現(xiàn)次數(shù);基于預(yù)處理數(shù)據(jù)集、詞頻數(shù)據(jù)集以及實(shí)詞詞語所屬新聞的展示信息確定各個(gè)實(shí)詞詞語的突發(fā)性,并將突發(fā)性滿足第一條件的實(shí)詞詞語確定為突發(fā)詞;對多個(gè)突發(fā)詞組成的突發(fā)詞集進(jìn)行基于詞語共現(xiàn)性的相似度計(jì)算,構(gòu)建所述多個(gè)突發(fā)詞之間的相似度矩陣;對相似度矩陣進(jìn)行聚類處理,并基于聚類結(jié)果確定突發(fā)事件。上述實(shí)現(xiàn)方案將新聞數(shù)據(jù)特征與詞語自身特征結(jié)合來計(jì)算突發(fā)性,能夠有效提高提取突發(fā)詞的準(zhǔn)確度,從而整體上提升突發(fā)事件檢測結(jié)果的準(zhǔn)確性。 |
