一種網(wǎng)絡(luò)輿情信息處理方法和裝置
基本信息
申請?zhí)?/td> | CN201310113356.1 | 申請日 | - |
公開(公告)號 | CN103246644B | 公開(公告)日 | 2017-05-03 |
申請公布號 | CN103246644B | 申請公布日 | 2017-05-03 |
分類號 | G06F17/28(2006.01)I;G06F17/30(2006.01)I | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 張宏剛;羅峰;黃蘇支;李娜 | 申請(專利權(quán))人 | 億贊普(北京)科技有限公司 |
代理機構(gòu) | 北京潤澤恒知識產(chǎn)權(quán)代理有限公司 | 代理人 | 蘇培華 |
地址 | 100081 北京市海淀區(qū)南大街東北旺北京中關(guān)村軟件園孵化器1號樓C座三層1322-D | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種網(wǎng)絡(luò)輿情信息處理方法和裝置,所述方法包括:從網(wǎng)絡(luò)數(shù)據(jù)源獲取網(wǎng)頁;獲取網(wǎng)絡(luò)熱詞;將所述網(wǎng)絡(luò)熱詞和所述網(wǎng)頁對應(yīng)的文檔存儲在數(shù)據(jù)集合中;從所述數(shù)據(jù)集合中提取網(wǎng)頁文檔進行分詞;從所述分詞結(jié)果中獲取目標(biāo)情感詞和基準(zhǔn)情感詞;計算所述目標(biāo)情感詞與基準(zhǔn)情感詞的語義距離;根據(jù)所述語義距離判斷所述網(wǎng)頁文檔的情感傾向。由于語義距離能夠反映出目標(biāo)情感詞與基準(zhǔn)情感詞之間關(guān)聯(lián)的緊密程度,以及情感詞在文檔中不同位置對情感傾向的影響,因此,有效提高了對文檔情感傾向判斷的準(zhǔn)確性,這樣一來,也就大大提高了對網(wǎng)絡(luò)輿情信息判斷的準(zhǔn)確性,為網(wǎng)絡(luò)輿情信息的后續(xù)處理提供了更為真實、準(zhǔn)確的基礎(chǔ)。 |
