基于BiLSTM和注意力機制的圖文多模態(tài)情感識別方法

基本信息

申請?zhí)?/td> CN202111021378.6 申請日 -
公開(公告)號 CN113705703A 公開(公告)日 2021-11-26
申請公布號 CN113705703A 申請公布日 2021-11-26
分類號 G06K9/62(2006.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I 分類 計算;推算;計數(shù);
發(fā)明人 金勇;胡林利;陳宏明 申請(專利權)人 武漢長江通信產業(yè)集團股份有限公司
代理機構 上海精晟知識產權代理有限公司 代理人 劉點
地址 430000湖北省武漢市東湖開發(fā)區(qū)關東工業(yè)園文華路2號
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了基于BiLSTM和注意力機制的圖文多模態(tài)情感識別方法,包括如下步驟:采集文本數(shù)據(jù)和圖片數(shù)據(jù);向量預處理,文本和圖片先單獨進行向量表達;文本向量和圖片向量各自均經過注意力機制attention和GRU模型的結合訓練;文本和圖片的向量聯(lián)合起來通過softmax函數(shù)進行最終綜合結果的識別。本發(fā)明采用WORD2VEC和CNN技術分別對文本和圖片進行預處理得到初步向量表達,然后采用BiLSTM、GRU和注意力機制進行交叉訓練,再將結果融合到softmax層進行最終監(jiān)督式標簽識別。實驗針對19000條以上的數(shù)據(jù)(每條數(shù)據(jù)包含文本和圖片)進行模型訓練分析,結果證明融合了圖片和文字的機器學習效果更好。