一種基于多模型的視頻動(dòng)作識(shí)別檢測(cè)方法

基本信息

申請(qǐng)?zhí)?/td> CN201911108892.6 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN112800816A 公開(kāi)(公告)日 2021-05-14
申請(qǐng)公布號(hào) CN112800816A 申請(qǐng)公布日 2021-05-14
分類(lèi)號(hào) G06K9/00;G06N3/04 分類(lèi) 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 張飛虎 申請(qǐng)(專(zhuān)利權(quán))人 北京卡爾斯通科技有限公司
代理機(jī)構(gòu) - 代理人 -
地址 100089 北京市海淀區(qū)上地信息路1號(hào)(北京實(shí)創(chuàng)高科技發(fā)展總公司1-2號(hào))B棟1-8層8-838室
法律狀態(tài) -

摘要

摘要 本發(fā)明公開(kāi)了一種基于多模型的視頻動(dòng)作識(shí)別檢測(cè)方法,具體包括以下步驟:S1、利用2D姿態(tài)估計(jì)技術(shù),對(duì)相機(jī)實(shí)時(shí)傳遞過(guò)來(lái)的包含人的視頻流做人的關(guān)鍵點(diǎn)進(jìn)行檢測(cè),獲得2D的姿態(tài);S2、采用2層堆疊的長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)對(duì)視頻中的人在2D的姿態(tài)下做動(dòng)作識(shí)別;S3、輸出分析結(jié)果;本發(fā)明涉及視頻分析技術(shù)領(lǐng)域。該基于多模型的視頻動(dòng)作識(shí)別檢測(cè)方法,動(dòng)作識(shí)別部分采用2層堆疊的LSTM做2D姿態(tài)估計(jì),精度非常高,尤其是在單人簡(jiǎn)單場(chǎng)景下,有利于后續(xù)模型對(duì)2D姿態(tài)結(jié)果的分析,且長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)能夠很好的解決動(dòng)作識(shí)別問(wèn)題,能夠提高視覺(jué)監(jiān)控系統(tǒng)捕獲視頻中犯罪行為的概率;有助于視頻檢索;能夠提高游戲體驗(yàn);能夠輔助機(jī)器人識(shí)別人的動(dòng)作。