一種基于動態(tài)注意力機制的多事件視頻描述方法

基本信息

申請?zhí)?/td> CN201911136308.8 申請日 -
公開(公告)號 CN110929092A 公開(公告)日 2020-03-27
申請公布號 CN110929092A 申請公布日 2020-03-27
分類號 G06F16/71;G06F16/78;G06F16/75;G06N3/04 分類 計算;推算;計數(shù);
發(fā)明人 謝洪平;劉迪;諸雅琴;黃濤;陳勇;杜長青;吳威;王昊;林東陽;陳喆 申請(專利權(quán))人 金卯新能源集團(tuán)有限公司
代理機構(gòu) 南京匯盛專利商標(biāo)事務(wù)所(普通合伙) 代理人 國網(wǎng)江蘇省電力工程咨詢有限公司;東南大學(xué);金卯新能源集團(tuán)有限公司;國網(wǎng)江蘇省電力有限公司
地址 210000 江蘇省南京市鼓樓區(qū)北京西路22號
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種基于動態(tài)注意力機制的多事件視頻描述方法,包括如下步驟:將視頻序列輸入三維卷積神經(jīng)網(wǎng)絡(luò),提取視頻的視覺特征;采用基于注意力機制的視頻編碼層對視覺特征進(jìn)行編碼,并將特征編碼輸入到事件預(yù)測層;事件預(yù)測層根據(jù)視頻編碼信息對各個事件進(jìn)行預(yù)測;事件描述層根據(jù)事件預(yù)測結(jié)果獲取各事件視覺特征,并動態(tài)結(jié)合自身的上下文信息產(chǎn)生各事件的文字描述。所述方法克服了現(xiàn)有多事件視頻描述方法并行性差,效率低的缺點,同時保證了視頻描述生成的準(zhǔn)確性,并能夠采用端到端的方式進(jìn)行模型的訓(xùn)練。