一種視頻/圖片-文本跨模態(tài)檢索方法

基本信息

申請?zhí)?/td> CN202011501900.6 申請日 -
公開(公告)號 CN112488133B 公開(公告)日 2022-06-14
申請公布號 CN112488133B 申請公布日 2022-06-14
分類號 G06V10/44(2022.01)I;G06V10/764(2022.01)I;G06V10/74(2022.01)I;G06K9/62(2022.01)I;G06N20/00(2019.01)I 分類 計算;推算;計數(shù);
發(fā)明人 楊陽;位紀偉 申請(專利權)人 電子科技大學廣東電子信息工程研究院
代理機構 成都行之專利代理事務所(普通合伙) 代理人 -
地址 550025貴州省貴陽市花溪區(qū)
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種視頻/圖片?文本跨模態(tài)檢索方法,在損失函數(shù)設計的兩個關鍵準則下(損失函數(shù)的值隨著與正對相似度分數(shù)成反比,與負對相似度分數(shù)成正比;不同的相似度分數(shù)應有不同的懲罰強度)構建了一個新的指數(shù)損失函數(shù),該指數(shù)損失函數(shù)能為不同的視頻/圖片、文本依據(jù)它們的相似度分配不同的權重值,從而加速深度度量學習模型收斂,并學習獲得高度魯棒的視頻/圖片映射、文本映射的網(wǎng)絡參數(shù),提高跨模態(tài)檢索精度,同時,極大減少了深度度量學習過程中的超參數(shù),在保證精度和收斂速度的前提下,減少實驗驗證超參數(shù)的工作量。