一種突發(fā)事件檢測(cè)方法及裝置
基本信息
申請(qǐng)?zhí)?/td> | CN202111120270.2 | 申請(qǐng)日 | - |
公開(kāi)(公告)號(hào) | CN113836267A | 公開(kāi)(公告)日 | 2021-12-24 |
申請(qǐng)公布號(hào) | CN113836267A | 申請(qǐng)公布日 | 2021-12-24 |
分類(lèi)號(hào) | G06F16/33(2019.01)I;G06F16/335(2019.01)I;G06F16/35(2019.01)I;G06F40/284(2020.01)I | 分類(lèi) | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 張君維;豐蘇;馬志遠(yuǎn);李靜;王歡;王慶春;于大東;郭爽 | 申請(qǐng)(專(zhuān)利權(quán))人 | 國(guó)家市場(chǎng)監(jiān)督管理總局信息中心 |
代理機(jī)構(gòu) | 北京集佳知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | 劉樂(lè) |
地址 | 100088北京市海淀區(qū)馬甸東路9號(hào) | ||
法律狀態(tài) | - |
摘要
摘要 | 本申請(qǐng)公開(kāi)了一種突發(fā)事件檢測(cè)方法及裝置,方法包括:對(duì)新聞數(shù)據(jù)集進(jìn)行第一處理,得到預(yù)處理數(shù)據(jù)集和對(duì)應(yīng)的詞頻數(shù)據(jù)集,預(yù)處理器數(shù)據(jù)集中包含多個(gè)實(shí)詞詞語(yǔ),詞頻數(shù)據(jù)集中包含實(shí)詞詞語(yǔ)的出現(xiàn)次數(shù);基于預(yù)處理數(shù)據(jù)集、詞頻數(shù)據(jù)集以及實(shí)詞詞語(yǔ)所屬新聞的展示信息確定各個(gè)實(shí)詞詞語(yǔ)的突發(fā)性,并將突發(fā)性滿(mǎn)足第一條件的實(shí)詞詞語(yǔ)確定為突發(fā)詞;對(duì)多個(gè)突發(fā)詞組成的突發(fā)詞集進(jìn)行基于詞語(yǔ)共現(xiàn)性的相似度計(jì)算,構(gòu)建所述多個(gè)突發(fā)詞之間的相似度矩陣;對(duì)相似度矩陣進(jìn)行聚類(lèi)處理,并基于聚類(lèi)結(jié)果確定突發(fā)事件。上述實(shí)現(xiàn)方案將新聞數(shù)據(jù)特征與詞語(yǔ)自身特征結(jié)合來(lái)計(jì)算突發(fā)性,能夠有效提高提取突發(fā)詞的準(zhǔn)確度,從而整體上提升突發(fā)事件檢測(cè)結(jié)果的準(zhǔn)確性。 |
