一種基于3D深度卷積網(wǎng)絡(luò)的人類(lèi)行為識(shí)別的方法

基本信息

申請(qǐng)?zhí)?/td> CN201710697809.8 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN107506712B 公開(kāi)(公告)日 2021-05-18
申請(qǐng)公布號(hào) CN107506712B 申請(qǐng)公布日 2021-05-18
分類(lèi)號(hào) G06K9/00;G06K9/62;G06N3/04 分類(lèi) 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 高聯(lián)麗;宋井寬;王軒瀚;邵杰;申洪宇 申請(qǐng)(專(zhuān)利權(quán))人 中國(guó)農(nóng)業(yè)銀行股份有限公司成都錦城支行
代理機(jī)構(gòu) 北京眾合誠(chéng)成知識(shí)產(chǎn)權(quán)代理有限公司 代理人 夏艷
地址 610015 四川省成都市高新區(qū)天府三街69號(hào)大源國(guó)際1棟21層2106號(hào)
法律狀態(tài) -

摘要

摘要 本發(fā)明屬于計(jì)算機(jī)視覺(jué)視頻動(dòng)作識(shí)別領(lǐng)域,公開(kāi)了一種基于3D深度卷積網(wǎng)絡(luò)的人類(lèi)行為識(shí)別的方法,所述方法首先將一個(gè)視頻劃分為一系列連續(xù)的視頻片段;然后,將連續(xù)的視頻片段輸入到由卷積計(jì)算層和時(shí)空金字塔池化層組成的3D神經(jīng)網(wǎng)絡(luò)得到連續(xù)的視頻片段特征;然后通過(guò)長(zhǎng)短記憶模型計(jì)算全局的視頻特征作為行為模式。本發(fā)明技術(shù)具有明顯優(yōu)勢(shì),通過(guò)改進(jìn)了標(biāo)準(zhǔn)的3維卷積網(wǎng)絡(luò)C3D,引入多級(jí)池化能夠?qū)θ我夥直媛屎蜁r(shí)長(zhǎng)的視頻片段進(jìn)行特征提?。煌瑫r(shí)提高模型對(duì)行為變化大的魯棒性,有利于在保持視頻質(zhì)量的情況下增加視頻訓(xùn)練數(shù)據(jù)規(guī)模;通過(guò)各個(gè)運(yùn)動(dòng)子狀態(tài)進(jìn)行關(guān)聯(lián)性信息嵌入提高行為信息的完整性。