一種基于注意力機(jī)制的深度監(jiān)督跨模態(tài)對抗學(xué)習(xí)方法
基本信息
申請?zhí)?/td> | CN202110144443.8 | 申請日 | - |
公開(公告)號 | CN112905822A | 公開(公告)日 | 2021-06-04 |
申請公布號 | CN112905822A | 申請公布日 | 2021-06-04 |
分類號 | G06F16/55;G06F16/583;G06F16/35;G06F16/33;G06K9/62;G06N3/04;G06N3/08 | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 曾煥強(qiáng);王欣唯;朱建清;廖昀;劉青松;陳虢 | 申請(專利權(quán))人 | 廈門華聯(lián)電子股份有限公司 |
代理機(jī)構(gòu) | 廈門市首創(chuàng)君合專利事務(wù)所有限公司 | 代理人 | 張松亭;楊鍇 |
地址 | 362000 福建省泉州市豐澤區(qū)城東城華北路269號 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明涉及一種基于注意力機(jī)制的深度監(jiān)督跨模態(tài)對抗學(xué)習(xí)方法,針對每個模態(tài)構(gòu)建深度學(xué)習(xí)網(wǎng)絡(luò)獲取深度特征,引入生成對抗網(wǎng)絡(luò),利用模態(tài)間的交叉判別借助注意力機(jī)制不斷提煉模態(tài)特征網(wǎng)絡(luò)的生成特征,在公共子空間進(jìn)行異質(zhì)性數(shù)據(jù)的度量的同時(shí),利用標(biāo)簽信息在標(biāo)簽空間對模態(tài)數(shù)據(jù)進(jìn)行深度監(jiān)督學(xué)習(xí)。如此構(gòu)建的網(wǎng)絡(luò),使得訓(xùn)練得到的基于注意力機(jī)制的跨模態(tài)深度監(jiān)督對抗模型具有良好的圖文互相檢索性能;在檢索過程中利用訓(xùn)練得到的網(wǎng)絡(luò)模型M對待查詢圖像(文本)和候選庫中的文本(圖像)進(jìn)行特征提取以及余弦距離計(jì)算,從而獲取待查詢圖像(文本)與候選庫中的文本(圖像)數(shù)據(jù)之間的相似度較高者,實(shí)現(xiàn)跨模態(tài)檢索。 |
