互聯(lián)網(wǎng)短文本主題特征與情感傾向分析方法、系統(tǒng)及介質(zhì)
基本信息
申請(qǐng)?zhí)?/td> | CN202110632146.8 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN113535891A | 公開(公告)日 | 2021-10-22 |
申請(qǐng)公布號(hào) | CN113535891A | 申請(qǐng)公布日 | 2021-10-22 |
分類號(hào) | G06F16/33;G06F16/332;G06F16/35;G06F16/953;G06K9/62 | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 郭浩哲;蒙圣光;廖玉敏 | 申請(qǐng)(專利權(quán))人 | 廣東東華發(fā)思特軟件有限公司 |
代理機(jī)構(gòu) | 廣州嘉權(quán)專利商標(biāo)事務(wù)所有限公司 | 代理人 | 張志輝 |
地址 | 519000 廣東省珠海市橫琴新區(qū)環(huán)島東路創(chuàng)意谷1889號(hào)20棟B座512室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了互聯(lián)網(wǎng)短文本主題特征與情感傾向分析方法、系統(tǒng)及介質(zhì),其中方法包括:采集互聯(lián)網(wǎng)OTA資源對(duì)象及其評(píng)價(jià)信息;將OTA評(píng)價(jià)信息進(jìn)行分詞并聚類,得到主題特征;提取聚類分析主題特征維度下的分詞中的高頻詞,計(jì)算其情感傾向及特征傾向,歸類出特征詞庫及情感詞庫;以及篩選出特征領(lǐng)域停用詞詞庫;建立同義詞林;將評(píng)價(jià)信息拆分為短句,進(jìn)行分詞、同義詞林處理及停用詞處理;計(jì)算句子的情感向量,通過支持向量機(jī)計(jì)算情感傾向;確定分詞的特征傾向,并確定短句的特征主題;輸出該評(píng)價(jià)信息的特征主題和綜合情感傾向。本發(fā)明能夠精準(zhǔn)分析互聯(lián)網(wǎng)評(píng)價(jià)主題和行業(yè)口碑水平。 |
