基于社交媒體圖表示模型的社會(huì)風(fēng)險(xiǎn)事件抽取方法
基本信息
申請(qǐng)?zhí)?/td> | CN201610438133.6 | 申請(qǐng)日 | - |
公開(kāi)(公告)號(hào) | CN105956197A | 公開(kāi)(公告)日 | 2016-09-21 |
申請(qǐng)公布號(hào) | CN105956197A | 申請(qǐng)公布日 | 2016-09-21 |
分類(lèi)號(hào) | G06F17/30(2006.01)I | 分類(lèi) | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 凌立剛;朱海鵬 | 申請(qǐng)(專(zhuān)利權(quán))人 | 杭州量知數(shù)據(jù)科技有限公司 |
代理機(jī)構(gòu) | 杭州求是專(zhuān)利事務(wù)所有限公司 | 代理人 | 杭州量知數(shù)據(jù)科技有限公司 |
地址 | 310000 浙江省杭州市西湖區(qū)西溪路525號(hào)C樓492室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開(kāi)了一種基于社交媒體圖表示模型的社會(huì)風(fēng)險(xiǎn)事件抽取的方法。包括如下步驟:1)采用HCCG模型對(duì)事件建模,定義實(shí)體關(guān)系生成規(guī)則,刻畫(huà)事件屬性,利用詞級(jí)別與流級(jí)別的上下文對(duì)事件進(jìn)行多粒度抽取;2)根據(jù)被抽取事件的HCCG圖,利用最大公共子圖和最小公共超圖的信息量之比進(jìn)行相似度計(jì)算;3)通過(guò)社交媒體的上下文信息對(duì)HCCG進(jìn)行增量式聚類(lèi),在聚類(lèi)過(guò)程中逐漸突出新聞的事件要素;4)通過(guò)基于HCCG模型的聚類(lèi)結(jié)果進(jìn)行事件判別,判斷聚類(lèi)結(jié)果是否為真正的事件。本發(fā)明能有效地匯聚分散的社交媒體信息,直觀地用實(shí)體關(guān)系模型多粒度地表達(dá)中間和最終的事件探測(cè)結(jié)果,相比傳統(tǒng)的社交媒體事件抽取方法有更強(qiáng)的泛化應(yīng)用能力以及更高的精確性。 |
