一種深度監(jiān)督與特征融合的細(xì)粒度跨媒體檢索方法
基本信息
申請?zhí)?/td> | CN202111334293.3 | 申請日 | - |
公開(公告)號(hào) | CN113779283A | 公開(公告)日 | 2021-12-10 |
申請公布號(hào) | CN113779283A | 申請公布日 | 2021-12-10 |
分類號(hào) | G06F16/483(2019.01)I;G06F16/43(2019.01)I;G06F16/45(2019.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 姚亞洲;孫澤人;陳濤;張傳一;沈復(fù)民 | 申請(專利權(quán))人 | 南京碼極客科技有限公司 |
代理機(jī)構(gòu) | 成都君合集專利代理事務(wù)所(普通合伙) | 代理人 | 尹新路 |
地址 | 211899江蘇省南京市浦口區(qū)新北路1號(hào)江北國際智谷B棟5層 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明涉及深度學(xué)習(xí)技術(shù)領(lǐng)域,公開了一種深度監(jiān)督與特征融合的細(xì)粒度跨媒體檢索方法,包括:步驟S1.將圖像數(shù)據(jù)、視頻數(shù)據(jù)、文本數(shù)據(jù)和音頻數(shù)據(jù)分別輸入到媒體專用網(wǎng)絡(luò)中,將四種媒體數(shù)據(jù)子網(wǎng)絡(luò)最后一層的全連接層進(jìn)行權(quán)值共享,提取對應(yīng)的原始特征;步驟S2.將原始特征利用語義信息和標(biāo)簽信息輸入進(jìn)公共空間,同時(shí)媒體數(shù)據(jù)四種子網(wǎng)絡(luò)分別連接線性分類器,根據(jù)線性分類器內(nèi)的標(biāo)簽信息對提取到的媒體數(shù)據(jù)的原始特征進(jìn)行分類;步驟S3.預(yù)設(shè)三元組損失約束條件、分類損失約束條件和判別損失約束條件上,對公共空間內(nèi)媒體數(shù)據(jù)的分類特征進(jìn)行度量。本發(fā)明用于在標(biāo)簽空間和公共的特征表示空間內(nèi)最大程度地減小判別損失并學(xué)習(xí)各媒體特征的相似性。 |
