一種基于注意力機(jī)制的深度監(jiān)督跨模態(tài)對抗學(xué)習(xí)方法

基本信息

申請?zhí)?/td> CN202110144443.8 申請日 -
公開(公告)號 CN112905822A 公開(公告)日 2021-06-04
申請公布號 CN112905822A 申請公布日 2021-06-04
分類號 G06F16/55;G06F16/583;G06F16/35;G06F16/33;G06K9/62;G06N3/04;G06N3/08 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 曾煥強(qiáng);王欣唯;朱建清;廖昀;劉青松;陳虢 申請(專利權(quán))人 廈門華聯(lián)電子股份有限公司
代理機(jī)構(gòu) 廈門市首創(chuàng)君合專利事務(wù)所有限公司 代理人 張松亭;楊鍇
地址 362000 福建省泉州市豐澤區(qū)城東城華北路269號
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及一種基于注意力機(jī)制的深度監(jiān)督跨模態(tài)對抗學(xué)習(xí)方法,針對每個模態(tài)構(gòu)建深度學(xué)習(xí)網(wǎng)絡(luò)獲取深度特征,引入生成對抗網(wǎng)絡(luò),利用模態(tài)間的交叉判別借助注意力機(jī)制不斷提煉模態(tài)特征網(wǎng)絡(luò)的生成特征,在公共子空間進(jìn)行異質(zhì)性數(shù)據(jù)的度量的同時(shí),利用標(biāo)簽信息在標(biāo)簽空間對模態(tài)數(shù)據(jù)進(jìn)行深度監(jiān)督學(xué)習(xí)。如此構(gòu)建的網(wǎng)絡(luò),使得訓(xùn)練得到的基于注意力機(jī)制的跨模態(tài)深度監(jiān)督對抗模型具有良好的圖文互相檢索性能;在檢索過程中利用訓(xùn)練得到的網(wǎng)絡(luò)模型M對待查詢圖像(文本)和候選庫中的文本(圖像)進(jìn)行特征提取以及余弦距離計(jì)算,從而獲取待查詢圖像(文本)與候選庫中的文本(圖像)數(shù)據(jù)之間的相似度較高者,實(shí)現(xiàn)跨模態(tài)檢索。