基于人體動(dòng)作分析的語(yǔ)義識(shí)別方法及相關(guān)裝置

基本信息

申請(qǐng)?zhí)?/td> CN202111478146.3 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN114155606A 公開(kāi)(公告)日 2022-03-08
申請(qǐng)公布號(hào) CN114155606A 申請(qǐng)公布日 2022-03-08
分類(lèi)號(hào) G06V40/20(2022.01)I;G06V10/44(2022.01)I;G06V10/764(2022.01)I;G06V10/82(2022.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I 分類(lèi) 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 陳海波;李連峰;李新 申請(qǐng)(專(zhuān)利權(quán))人 深蘭人工智能應(yīng)用研究院(山東)有限公司
代理機(jī)構(gòu) 蘇州領(lǐng)躍知識(shí)產(chǎn)權(quán)代理有限公司 代理人 石伍軍
地址 250000山東省濟(jì)南市中國(guó)(山東)自由貿(mào)易試驗(yàn)區(qū)濟(jì)南片區(qū)經(jīng)十路漢峪金谷人工智能大廈十三層
法律狀態(tài) -

摘要

摘要 本發(fā)明提供了一種基于人體動(dòng)作分析的語(yǔ)義識(shí)別方法,包括:采集能夠反映出目標(biāo)用戶(hù)的動(dòng)作的視頻數(shù)據(jù);追蹤并檢測(cè)目標(biāo)用戶(hù)在所采集到的視頻數(shù)據(jù)的每一幀圖像中的預(yù)定區(qū)域內(nèi)的肢體和面部的關(guān)鍵點(diǎn),按照預(yù)置模板將其轉(zhuǎn)換為一維的數(shù)字向量,從而得到對(duì)應(yīng)于所述視頻數(shù)據(jù)的四維張量[1,1,fr,info],其中,fr表示視頻幀數(shù),info表示所述數(shù)字向量;將所述視頻數(shù)據(jù)的所述四維張量作為輸入數(shù)據(jù)輸入到預(yù)置的訓(xùn)練模型,經(jīng)由預(yù)置的語(yǔ)義識(shí)別模型預(yù)測(cè)出與所述目標(biāo)用戶(hù)的動(dòng)作對(duì)應(yīng)的語(yǔ)義,以及將預(yù)測(cè)出的語(yǔ)義進(jìn)行輸出。此外,還提供了基于人體動(dòng)作分析的語(yǔ)義識(shí)別裝置、電子設(shè)備及存儲(chǔ)介質(zhì)。根據(jù)本發(fā)明,能夠簡(jiǎn)單、高效且準(zhǔn)確地識(shí)別出目標(biāo)用戶(hù)的動(dòng)作的語(yǔ)義信息。