一種基于Attention-LSTM網絡的視頻行為識別方法
基本信息
申請?zhí)?/td> | CN201811397129.5 | 申請日 | - |
公開(公告)號 | CN109740419A | 公開(公告)日 | 2019-05-10 |
申請公布號 | CN109740419A | 申請公布日 | 2019-05-10 |
分類號 | G06K9/00(2006.01)I; G06N3/04(2006.01)I; G06N3/08(2006.01)I | 分類 | 計算;推算;計數; |
發(fā)明人 | 陸生禮; 龐偉; 向麗蘋; 范雪梅; 舒程昊; 吳成路; 阮小千; 梁彪; 鄒濤 | 申請(專利權)人 | 南京三寶科技股份有限公司 |
代理機構 | 南京經緯專利商標代理有限公司 | 代理人 | 施昊 |
地址 | 214135 江蘇省無錫市新吳區(qū)菱湖大道99號 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種基于Attention?LSTM網絡的視頻行為識別方法。通過光流圖序列生成模塊對輸入的RGB圖序列進行變換,得到光流圖序列;將光流圖序列與原RGB圖序列輸入時域注意力取幀模塊,分別選取兩種圖序列中非冗余的關鍵幀;將兩種圖的關鍵幀序列輸入AlexNet網絡特征提取模塊,分別提取出兩種幀圖的時序特征和空間特征,通過特征分權加強模塊,對最后一層卷積層輸出的特征圖執(zhí)行加重與動作相關性強的特征權重的操作;將兩個AlexNet網絡特征提取模塊輸出的特征圖輸入LSTM網絡行為識別模塊,分別對兩種圖片進行識別,并將兩種識別結果通過融合模塊按比例融合,得到最終的視頻行為識別結果。本發(fā)明不僅能實現從視頻中識別行為的功能,且能提高識別的準確率。 |
