一種網(wǎng)絡(luò)輿情信息處理方法和裝置
基本信息
申請(qǐng)?zhí)?/td> | CN201310113356.1 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN103246644B | 公開(公告)日 | 2017-05-03 |
申請(qǐng)公布號(hào) | CN103246644B | 申請(qǐng)公布日 | 2017-05-03 |
分類號(hào) | G06F17/28(2006.01)I;G06F17/30(2006.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 張宏剛;羅峰;黃蘇支;李娜 | 申請(qǐng)(專利權(quán))人 | 億贊普(北京)科技有限公司 |
代理機(jī)構(gòu) | 北京潤(rùn)澤恒知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | 蘇培華 |
地址 | 100081 北京市海淀區(qū)南大街東北旺北京中關(guān)村軟件園孵化器1號(hào)樓C座三層1322-D | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種網(wǎng)絡(luò)輿情信息處理方法和裝置,所述方法包括:從網(wǎng)絡(luò)數(shù)據(jù)源獲取網(wǎng)頁;獲取網(wǎng)絡(luò)熱詞;將所述網(wǎng)絡(luò)熱詞和所述網(wǎng)頁對(duì)應(yīng)的文檔存儲(chǔ)在數(shù)據(jù)集合中;從所述數(shù)據(jù)集合中提取網(wǎng)頁文檔進(jìn)行分詞;從所述分詞結(jié)果中獲取目標(biāo)情感詞和基準(zhǔn)情感詞;計(jì)算所述目標(biāo)情感詞與基準(zhǔn)情感詞的語義距離;根據(jù)所述語義距離判斷所述網(wǎng)頁文檔的情感傾向。由于語義距離能夠反映出目標(biāo)情感詞與基準(zhǔn)情感詞之間關(guān)聯(lián)的緊密程度,以及情感詞在文檔中不同位置對(duì)情感傾向的影響,因此,有效提高了對(duì)文檔情感傾向判斷的準(zhǔn)確性,這樣一來,也就大大提高了對(duì)網(wǎng)絡(luò)輿情信息判斷的準(zhǔn)確性,為網(wǎng)絡(luò)輿情信息的后續(xù)處理提供了更為真實(shí)、準(zhǔn)確的基礎(chǔ)。 |
