一種基于層次attention的微博謠言立場(chǎng)檢測(cè)方法

基本信息

申請(qǐng)?zhí)?/td> CN201810537591.4 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN108804608B 公開(kāi)(公告)日 2021-08-27
申請(qǐng)公布號(hào) CN108804608B 申請(qǐng)公布日 2021-08-27
分類號(hào) G06F16/951(2019.01)I;G06F16/953(2019.01)I;G06F16/9532(2019.01)I;G06F16/332(2019.01)I;G06F16/35(2019.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 夏睿;李銀波 申請(qǐng)(專利權(quán))人 武漢烽火普天信息技術(shù)有限公司
代理機(jī)構(gòu) 上海精晟知識(shí)產(chǎn)權(quán)代理有限公司 代理人 馮子玲
地址 430000湖北省武漢市東湖開(kāi)發(fā)區(qū)關(guān)山二路附4號(hào)
法律狀態(tài) -

摘要

摘要 本發(fā)明公開(kāi)了一種基于層次attention的微博謠言立場(chǎng)檢測(cè)方法,包括以下步驟:步驟一、對(duì)微博謠言數(shù)據(jù)進(jìn)行預(yù)處理;步驟二、根據(jù)微博謠言數(shù)據(jù)的回復(fù)與評(píng)論的結(jié)構(gòu)特點(diǎn),將預(yù)處理后的微博謠言數(shù)據(jù)抽象為樹(shù)結(jié)構(gòu);步驟三、從樹(shù)結(jié)構(gòu)對(duì)話中抽取根節(jié)點(diǎn)到父節(jié)點(diǎn)的文本序列作為目標(biāo)文本的上下文;步驟四、構(gòu)建基于層次attention的LSTM模型,將序列文本進(jìn)行向量表示并通過(guò)LSTM模型進(jìn)行分類;本發(fā)明通過(guò)引入上下文以及原始謠言的信息,構(gòu)建基于層次attention的謠言立場(chǎng)檢測(cè)模型,利用雙向LSTM對(duì)文本進(jìn)行編碼表示,抽取對(duì)話序列,在序列上利用句子級(jí)attention學(xué)習(xí)上下文信息,最終達(dá)到分類目的,克服了傳統(tǒng)方法沒(méi)有充分利用社交媒體謠言語(yǔ)料特性以及沒(méi)有利用上下文的缺陷。