一種基于多模態(tài)差異性融合網(wǎng)絡(luò)的RGB-D顯著性目標(biāo)檢測方法
基本信息
申請?zhí)?/td> | CN202210308520.3 | 申請日 | - |
公開(公告)號 | CN114693952A | 公開(公告)日 | 2022-07-01 |
申請公布號 | CN114693952A | 申請公布日 | 2022-07-01 |
分類號 | G06V10/46(2022.01)I;G06K9/62(2022.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I;G06V10/80(2022.01)I;G06V10/82(2022.01)I;G06V10/774(2022.01)I | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 夏晨星;段松松;黃榮梅;孫延光;段秀真;王晶晶 | 申請(專利權(quán))人 | 安徽理工大學(xué) |
代理機構(gòu) | - | 代理人 | - |
地址 | 232001安徽省淮南市山南新區(qū)泰豐大街168號 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明提供一種基于多模態(tài)差異性融合網(wǎng)絡(luò)的RGB?D顯著性目標(biāo)檢測方法,屬于圖像顯著性檢測技術(shù),所述方法利用Swin Transformer提取包含全局上下文信息的RGB和Depth特征,用于給出場景的顯著性目標(biāo)推理。本發(fā)明主要通過探索RGB和Depth模態(tài)之間的差異性分析顯著性在這兩個模態(tài)的聯(lián)系和區(qū)別,并設(shè)計一個差異性融合網(wǎng)絡(luò)融合跨模態(tài)特征用于捕獲完整的顯著目標(biāo)。本發(fā)明包括以下幾個步驟:(1)采用Swin Transformer提取跨模態(tài)特征;(2)使用雙向融合方式融合RGB和Depth特征生成Fusion流;(3)使用三流差異性監(jiān)督機制獲取模態(tài)之間差異性;(4)利用該差異性融合跨模態(tài)特征;(5)使用目級聯(lián)聚合解碼器對融合的跨模態(tài)特征進行顯著性的推理和解碼,生成預(yù)測的顯著性圖。 |
