一種基于Attention-LSTM網(wǎng)絡(luò)的視頻行為識別方法

基本信息

申請?zhí)?/td> CN201811397129.5 申請日 -
公開(公告)號 CN109740419B 公開(公告)日 2021-03-02
申請公布號 CN109740419B 申請公布日 2021-03-02
分類號 G06N3/08(2006.01)I;G06K9/00(2006.01)I;G06N3/04(2006.01)I 分類 計算;推算;計數(shù);
發(fā)明人 陸生禮;龐偉;向麗蘋;范雪梅;舒程昊;吳成路;阮小千;梁彪;鄒濤 申請(專利權(quán))人 南京三寶科技股份有限公司
代理機構(gòu) 南京經(jīng)緯專利商標(biāo)代理有限公司 代理人 施昊
地址 214135江蘇省無錫市新吳區(qū)菱湖大道99號
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種基于Attention?LSTM網(wǎng)絡(luò)的視頻行為識別方法。通過光流圖序列生成模塊對輸入的RGB圖序列進行變換,得到光流圖序列;將光流圖序列與原RGB圖序列輸入時域注意力取幀模塊,分別選取兩種圖序列中非冗余的關(guān)鍵幀;將兩種圖的關(guān)鍵幀序列輸入AlexNet網(wǎng)絡(luò)特征提取模塊,分別提取出兩種幀圖的時序特征和空間特征,通過特征分權(quán)加強模塊,對最后一層卷積層輸出的特征圖執(zhí)行加重與動作相關(guān)性強的特征權(quán)重的操作;將兩個AlexNet網(wǎng)絡(luò)特征提取模塊輸出的特征圖輸入LSTM網(wǎng)絡(luò)行為識別模塊,分別對兩種圖片進行識別,并將兩種識別結(jié)果通過融合模塊按比例融合,得到最終的視頻行為識別結(jié)果。本發(fā)明不僅能實現(xiàn)從視頻中識別行為的功能,且能提高識別的準(zhǔn)確率。??