一種基于層次attention的微博謠言立場檢測方法

基本信息

申請?zhí)?/td> CN201810537591.4 申請日 -
公開(公告)號 CN108804608A 公開(公告)日 2018-11-13
申請公布號 CN108804608A 申請公布日 2018-11-13
分類號 G06F17/30 分類 計算;推算;計數(shù);
發(fā)明人 夏睿;李銀波 申請(專利權(quán))人 武漢烽火普天信息技術(shù)有限公司
代理機(jī)構(gòu) 上海精晟知識產(chǎn)權(quán)代理有限公司 代理人 武漢烽火普天信息技術(shù)有限公司
地址 430000 湖北省武漢市東湖開發(fā)區(qū)關(guān)山二路附4號
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種基于層次attention的微博謠言立場檢測方法,包括以下步驟:步驟一、對微博謠言數(shù)據(jù)進(jìn)行預(yù)處理;步驟二、根據(jù)微博謠言數(shù)據(jù)的回復(fù)與評論的結(jié)構(gòu)特點(diǎn),將預(yù)處理后的微博謠言數(shù)據(jù)抽象為樹結(jié)構(gòu);步驟三、從樹結(jié)構(gòu)對話中抽取根節(jié)點(diǎn)到父節(jié)點(diǎn)的文本序列作為目標(biāo)文本的上下文;步驟四、構(gòu)建基于層次attention的LSTM模型,將序列文本進(jìn)行向量表示并通過LSTM模型進(jìn)行分類;本發(fā)明通過引入上下文以及原始謠言的信息,構(gòu)建基于層次attention的謠言立場檢測模型,利用雙向LSTM對文本進(jìn)行編碼表示,抽取對話序列,在序列上利用句子級attention學(xué)習(xí)上下文信息,最終達(dá)到分類目的,克服了傳統(tǒng)方法沒有充分利用社交媒體謠言語料特性以及沒有利用上下文的缺陷。