一種基于微博的熱點(diǎn)信息提取的方法和裝置
基本信息
申請(qǐng)?zhí)?/td> | CN201310177797.8 | 申請(qǐng)日 | - |
公開(kāi)(公告)號(hào) | CN103324665B | 公開(kāi)(公告)日 | 2017-05-03 |
申請(qǐng)公布號(hào) | CN103324665B | 申請(qǐng)公布日 | 2017-05-03 |
分類(lèi)號(hào) | G06F17/30(2006.01)I | 分類(lèi) | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 杜毅;羅峰;黃蘇支;李娜 | 申請(qǐng)(專(zhuān)利權(quán))人 | 億贊普(北京)科技有限公司 |
代理機(jī)構(gòu) | 北京潤(rùn)澤恒知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | 趙娟 |
地址 | 100081 北京市海淀區(qū)南大街東北旺北京中關(guān)村軟件園孵化器1號(hào)樓C座三層1322-D | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明提供了一種基于微博的熱點(diǎn)信息提取的方法和裝置,其中所述方法包括:獲取微博數(shù)據(jù)集合;從所述微博數(shù)據(jù)集合中提取特征信息,所述特征信息包括文本特征、時(shí)序特征、社交關(guān)系特征;依據(jù)所述文本特征、時(shí)序特征、社交關(guān)系特征聚類(lèi)成一個(gè)或多個(gè)話(huà)題;提取每個(gè)話(huà)題的關(guān)鍵事件因子,將基于所述關(guān)鍵事件因子組成熱點(diǎn)信息。本發(fā)明綜合考慮了微博數(shù)據(jù)的特點(diǎn),可以提高基于微博的熱點(diǎn)信息發(fā)現(xiàn)的準(zhǔn)確度。 |
