一種網(wǎng)絡(luò)輿情信息處理方法和裝置

基本信息

申請?zhí)?/td> CN201310113356.1 申請日 -
公開(公告)號 CN103246644B 公開(公告)日 2017-05-03
申請公布號 CN103246644B 申請公布日 2017-05-03
分類號 G06F17/28(2006.01)I;G06F17/30(2006.01)I 分類 計算;推算;計數(shù);
發(fā)明人 張宏剛;羅峰;黃蘇支;李娜 申請(專利權(quán))人 億贊普(北京)科技有限公司
代理機構(gòu) 北京潤澤恒知識產(chǎn)權(quán)代理有限公司 代理人 蘇培華
地址 100081 北京市海淀區(qū)南大街東北旺北京中關(guān)村軟件園孵化器1號樓C座三層1322-D
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種網(wǎng)絡(luò)輿情信息處理方法和裝置,所述方法包括:從網(wǎng)絡(luò)數(shù)據(jù)源獲取網(wǎng)頁;獲取網(wǎng)絡(luò)熱詞;將所述網(wǎng)絡(luò)熱詞和所述網(wǎng)頁對應(yīng)的文檔存儲在數(shù)據(jù)集合中;從所述數(shù)據(jù)集合中提取網(wǎng)頁文檔進行分詞;從所述分詞結(jié)果中獲取目標(biāo)情感詞和基準(zhǔn)情感詞;計算所述目標(biāo)情感詞與基準(zhǔn)情感詞的語義距離;根據(jù)所述語義距離判斷所述網(wǎng)頁文檔的情感傾向。由于語義距離能夠反映出目標(biāo)情感詞與基準(zhǔn)情感詞之間關(guān)聯(lián)的緊密程度,以及情感詞在文檔中不同位置對情感傾向的影響,因此,有效提高了對文檔情感傾向判斷的準(zhǔn)確性,這樣一來,也就大大提高了對網(wǎng)絡(luò)輿情信息判斷的準(zhǔn)確性,為網(wǎng)絡(luò)輿情信息的后續(xù)處理提供了更為真實、準(zhǔn)確的基礎(chǔ)。