基于深度學習的實時手勢識別方法及系統(tǒng)
基本信息
申請?zhí)?/td> | CN202110574202.7 | 申請日 | - |
公開(公告)號 | CN113269089A | 公開(公告)日 | 2021-08-17 |
申請公布號 | CN113269089A | 申請公布日 | 2021-08-17 |
分類號 | G06K9/00;G06K9/46;G06K9/62;G06N3/04;G06N3/08;G06F3/01 | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 宋海濤;盛斌;王資凱;王天逸;譚峰;李佳佳;趙亦博;鞠睿 | 申請(專利權)人 | 上海人工智能研究院有限公司 |
代理機構 | 重慶航圖知識產(chǎn)權代理事務所(普通合伙) | 代理人 | 孫方 |
地址 | 200000 上海市閔行區(qū)劍川路930號3幢201室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種基于深度學習的實時手勢識別方法及系統(tǒng),包括以下步驟:采集圖像并利用目標檢測網(wǎng)絡提取所述圖像中的手部深度圖像;將手部深度圖像轉(zhuǎn)化成3D體素化數(shù)據(jù),并輸入到V2V?PoseNet網(wǎng)絡中獲得手部關鍵點數(shù)據(jù);所述V2V?PoseNet網(wǎng)絡為進行剪枝處理的V2V?PoseNet網(wǎng)絡;對手部關鍵點數(shù)據(jù)進行預處理后輸入到分類網(wǎng)絡進行手勢動作分類得到手勢類別。本發(fā)明提供的方法中結合前沿的深度學習模型,避免了引入人工定義特征,模型泛化能力和表達能力較強,擴展性良好。對于系統(tǒng)中使用到的現(xiàn)有模型根據(jù)任務的需要進行了剪枝和優(yōu)化,在不影響精度的前提下提高了模型的速度。在數(shù)據(jù)集MSRAHand上的關鍵點檢測和動作分類效果良好。 |
