一種從示教視頻學(xué)習(xí)物體的可供性方法

基本信息

申請(qǐng)?zhí)?/td> CN202110242514.8 申請(qǐng)日 -
公開(公告)號(hào) CN112949501A 公開(公告)日 2021-06-11
申請(qǐng)公布號(hào) CN112949501A 申請(qǐng)公布日 2021-06-11
分類號(hào) G06K9/00;G06K9/32;G06K9/62;G06N3/04;G06N3/08 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 黃煒;顏天信 申請(qǐng)(專利權(quán))人 安徽省科億信息科技有限公司
代理機(jī)構(gòu) 合肥律眾知識(shí)產(chǎn)權(quán)代理有限公司 代理人 趙娟
地址 230000 安徽省合肥市黃山路602號(hào)國家大學(xué)科技園創(chuàng)業(yè)孵化中心
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種從示教視頻學(xué)習(xí)物體的可供性方法,該方法包括從示教視頻幀中檢測(cè)手部區(qū)域;搭建手部相關(guān)選擇網(wǎng)絡(luò),并進(jìn)行訓(xùn)練;利用訓(xùn)練好的手部相關(guān)選擇網(wǎng)絡(luò)提取上述手部檢測(cè)數(shù)據(jù)中人與物體發(fā)生交互的關(guān)鍵幀;將關(guān)鍵幀中人和物體交互相關(guān)區(qū)域遷移到靜態(tài)物體的圖像中,并通過蒸餾損失將靜態(tài)物體映射到人操作物體的狀態(tài);得到可供性標(biāo)定網(wǎng)絡(luò);用挑選出的關(guān)鍵幀訓(xùn)練網(wǎng)絡(luò),優(yōu)化參數(shù),得到訓(xùn)練后的可供性標(biāo)定網(wǎng)絡(luò);將待識(shí)別物體的靜態(tài)物體的圖像以及可供性標(biāo)簽輸入到網(wǎng)絡(luò)中,輸出物體上能完成該相互作用的區(qū)域;本發(fā)明具有比較好的泛化能力,對(duì)于未見過的物體,能根據(jù)物體上某些局部特征學(xué)習(xí)到相關(guān)相互作用的區(qū)域。