一種基于多模型的視頻動(dòng)作識(shí)別檢測(cè)方法
基本信息
申請(qǐng)?zhí)?/td> | CN201911108892.6 | 申請(qǐng)日 | - |
公開(kāi)(公告)號(hào) | CN112800816A | 公開(kāi)(公告)日 | 2021-05-14 |
申請(qǐng)公布號(hào) | CN112800816A | 申請(qǐng)公布日 | 2021-05-14 |
分類(lèi)號(hào) | G06K9/00;G06N3/04 | 分類(lèi) | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 張飛虎 | 申請(qǐng)(專(zhuān)利權(quán))人 | 北京卡爾斯通科技有限公司 |
代理機(jī)構(gòu) | - | 代理人 | - |
地址 | 100089 北京市海淀區(qū)上地信息路1號(hào)(北京實(shí)創(chuàng)高科技發(fā)展總公司1-2號(hào))B棟1-8層8-838室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開(kāi)了一種基于多模型的視頻動(dòng)作識(shí)別檢測(cè)方法,具體包括以下步驟:S1、利用2D姿態(tài)估計(jì)技術(shù),對(duì)相機(jī)實(shí)時(shí)傳遞過(guò)來(lái)的包含人的視頻流做人的關(guān)鍵點(diǎn)進(jìn)行檢測(cè),獲得2D的姿態(tài);S2、采用2層堆疊的長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)對(duì)視頻中的人在2D的姿態(tài)下做動(dòng)作識(shí)別;S3、輸出分析結(jié)果;本發(fā)明涉及視頻分析技術(shù)領(lǐng)域。該基于多模型的視頻動(dòng)作識(shí)別檢測(cè)方法,動(dòng)作識(shí)別部分采用2層堆疊的LSTM做2D姿態(tài)估計(jì),精度非常高,尤其是在單人簡(jiǎn)單場(chǎng)景下,有利于后續(xù)模型對(duì)2D姿態(tài)結(jié)果的分析,且長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)能夠很好的解決動(dòng)作識(shí)別問(wèn)題,能夠提高視覺(jué)監(jiān)控系統(tǒng)捕獲視頻中犯罪行為的概率;有助于視頻檢索;能夠提高游戲體驗(yàn);能夠輔助機(jī)器人識(shí)別人的動(dòng)作。 |
