基于兩分支提議網(wǎng)絡(luò)的弱監(jiān)督視頻時段檢索方法及系統(tǒng)
基本信息
申請?zhí)?/td> | CN202011332463.X | 申請日 | - |
公開(公告)號 | CN112417206B | 公開(公告)日 | 2021-09-24 |
申請公布號 | CN112417206B | 申請公布日 | 2021-09-24 |
分類號 | G06F16/735;G06F16/78;G06F16/783 | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 童鑫遠 | 申請(專利權(quán))人 | 杭州一知智能科技有限公司 |
代理機構(gòu) | 杭州求是專利事務(wù)所有限公司 | 代理人 | 鄭海峰 |
地址 | 311200 浙江省杭州市蕭山區(qū)啟迪路198號杭州灣信息港F座7樓 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種基于兩分支提議網(wǎng)絡(luò)的弱監(jiān)督視頻時段檢索方法及系統(tǒng),屬于視頻檢索領(lǐng)域。主要包括如下步驟:1)針對于一組視頻、描述文本訓(xùn)練集,根據(jù)一個跨模態(tài)語言感知過濾器,學(xué)習出視頻信息和文本信息的聯(lián)合表征,并生成帶文本信息的增強視頻流與抑制視頻流。2)對于跨模態(tài)語言感知過濾器生成的輸出,根據(jù)一個參數(shù)共享的正則化兩分支提議網(wǎng)絡(luò),輸出針對于視頻和文本聯(lián)合表達的時段答案。本發(fā)明采用一種使用基于場景的跨模態(tài)估計法的語言感知過濾器生成增強視頻流和抑制視頻流,采用一種新穎的兩分支提議網(wǎng)絡(luò)同時考慮樣本間和樣本內(nèi)的對抗,采用提議正則化策略穩(wěn)定訓(xùn)練過程,有效地改善了模型性能。 |
