分割視頻物體的方法、裝置以及網(wǎng)絡(luò)模型訓(xùn)練方法

基本信息

申請(qǐng)?zhí)?/td> CN202110587943.9 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN113506316A 公開(kāi)(公告)日 2021-10-15
申請(qǐng)公布號(hào) CN113506316A 申請(qǐng)公布日 2021-10-15
分類號(hào) G06T7/246(2017.01)I;G06K9/32(2006.01)I;G06K9/34(2006.01)I;G06K9/62(2006.01)I;G06N3/04(2006.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 熊鵬飛;王培森 申請(qǐng)(專利權(quán))人 北京邁格威科技有限公司
代理機(jī)構(gòu) 北京超凡宏宇專利代理事務(wù)所(特殊普通合伙) 代理人 安衛(wèi)靜
地址 100090北京市海淀區(qū)科學(xué)院南路2號(hào)融科資訊中心A座316-318
法律狀態(tài) -

摘要

摘要 本申請(qǐng)實(shí)施例提供分割視頻物體的方法、裝置以及網(wǎng)絡(luò)模型訓(xùn)練方法,所述分割視頻物體的方法包括:提取當(dāng)前幀圖像之前的至少一張歷史幀圖像的特征,得到所述至少一張歷史幀圖像中各歷史幀圖像的特征對(duì);提取所述當(dāng)前幀圖像的特征,得到當(dāng)前幀圖像的特征對(duì);提取所述當(dāng)前幀圖像的特征,得到當(dāng)前幀的特征對(duì);根據(jù)所述各歷史幀圖像的特征對(duì)、所述當(dāng)前幀圖像的特征對(duì)和解碼器,獲取所述當(dāng)前幀圖像中感興趣目標(biāo)的分割掩膜;其中,所述至少一張歷史幀圖像中的各歷史幀圖像是所述當(dāng)前幀圖像的前一幀或多幀圖像,所述特征對(duì)包括鍵矩陣和值矩陣。本申請(qǐng)的一些實(shí)施例通過(guò)一個(gè)增強(qiáng)型短時(shí)記憶網(wǎng)絡(luò)實(shí)現(xiàn)幀間跟蹤,顯著提升了對(duì)當(dāng)前幀圖像的視頻物體分割精度。