一種融合顯性和隱性特征的中文微博情感分析方法

基本信息

申請?zhí)?/td> CN201410723617.6 申請日 -
公開(公告)號 CN104516947A 公開(公告)日 2015-04-15
申請公布號 CN104516947A 申請公布日 2015-04-15
分類號 G06F17/30(2006.01)I 分類 計算;推算;計數(shù);
發(fā)明人 陳鐵明;繆茹一 申請(專利權)人 杭州零零柒科技有限公司
代理機構(gòu) 杭州斯可睿專利事務所有限公司 代理人 王利強
地址 310000 浙江省杭州市西湖區(qū)西溪新天地商業(yè)中心(公元里)11幢5層501室
法律狀態(tài) -

摘要

摘要 一種融合顯性和隱性特征的中文微博情感分析方法,包括以下步驟:1)微博顯性特征處理,1.1)表情符號處理;1.2)情感詞處理;2)微博隱性特征處理:基于頻繁項集創(chuàng)建初始情感簇,每個初始情感簇文本都含有頻繁項集,采用知網(wǎng)的中文語義相似度模型,根據(jù)最大語義隸屬度原則分離各個初始情感簇;最后,通過定義簇間語義相似度矩陣,完成微博情感簇的凝聚式層次聚類,并優(yōu)化得到最終的情感簇,實現(xiàn)微博情感分析。本發(fā)明提供一種靈活性較高、可靠性較好的融合顯性和隱性特征的中文微博情感分析方法。