一種句子相似度的計算方法及基于該方法的輿情監(jiān)督方法

基本信息

申請?zhí)?/td> CN201810148814.8 申請日 -
公開(公告)號 CN108363692B 公開(公告)日 2021-04-02
申請公布號 CN108363692B 申請公布日 2021-04-02
分類號 G06F40/279(2020.01)I;G06F40/58(2020.01)I;G06F40/289(2020.01)I 分類 計算;推算;計數(shù);
發(fā)明人 馬曉敏;李為民 申請(專利權(quán))人 成都智庫二八六一信息技術(shù)有限公司
代理機構(gòu) 成都行之專利代理事務(wù)所(普通合伙) 代理人 王記明
地址 610000四川省成都市高新區(qū)益州大道中段1800號304室
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種句子相似度的計算方法及基于該方法的輿情監(jiān)督方法,該方法包括:從互聯(lián)網(wǎng)獲取輿情事件語料,進行內(nèi)容清洗后,將語料切分成短句;建立情緒語料庫和情況語料庫,將描述性短句放入情況庫,表達情緒的短句放入情緒庫,并根據(jù)情緒激烈程度對短句標注權(quán)重;將待識別長句切分成待識別短句,分別利用改進的句子相似度計算方法,計算其與情況庫和情緒庫中語料的相似度,確定長句情緒值;依照上述步驟依次對某一目標長句群進行識別,得到輿情事件所描述的誘因和情緒值分布。本發(fā)明的積極效果是:能夠?qū)毞诸I(lǐng)域輿情實現(xiàn)比較高的識別準確率,解決了相關(guān)技術(shù)中識別領(lǐng)域過于粗糙的問題。??