基于保序子矩陣和頻繁序列挖掘的電商評(píng)論情感分類方法

基本信息

申請?zhí)?/td> CN201710481733.5 申請日 -
公開(公告)號(hào) CN107357837B 公開(公告)日 2019-10-08
申請公布號(hào) CN107357837B 申請公布日 2019-10-08
分類號(hào) G06F16/33;G06F17/27;G06Q30/02 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 黃佳鋒;馬志豪;陳鑫;盧昕;薛云;胡曉暉 申請(專利權(quán))人 蘇州高航知識(shí)產(chǎn)權(quán)運(yùn)營有限公司
代理機(jī)構(gòu) 廣州粵高專利商標(biāo)代理有限公司 代理人 華南師范大學(xué)
地址 510631 廣東省廣州市天河區(qū)中山大道西55號(hào)
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了基于保序子矩陣和頻繁序列挖掘的電商評(píng)論情感分類方法,包括步驟:(1)對電商評(píng)論進(jìn)行預(yù)處理和中文分詞,計(jì)算得到近義詞的TF?IDF權(quán)重向量,然后基于保序子矩陣OPSM雙聚類算法挖掘出權(quán)重向量中的局部模式;(3)使用改進(jìn)的PrefixSpan算法挖掘分類頻繁短語特征,同時(shí)也通過詞語間隔等限制來提升頻繁短語區(qū)分情感傾向的能力;(4)將(2)和(3)步驟挖掘出來的特征轉(zhuǎn)化成0/1向量,作為分類器的輸入,最終得到電商評(píng)論的情感分類結(jié)果。本發(fā)明能夠準(zhǔn)確地挖掘出電商評(píng)論的情感分類特征,使?jié)撛谙M(fèi)者在購買商品前了解商品的評(píng)價(jià)信息,也能使商家更加充分地了解消費(fèi)者的意見,從而提高服務(wù)質(zhì)量。