基于多媒體語義解析的監(jiān)控視頻智能預(yù)警方法
基本信息
申請?zhí)?/td> | CN202110447507.1 | 申請日 | - |
公開(公告)號 | CN113111837A | 公開(公告)日 | 2021-07-13 |
申請公布號 | CN113111837A | 申請公布日 | 2021-07-13 |
分類號 | G06K9/00(2006.01)I;G06K9/62(2006.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 胡宇鵬;賈永坡;高贊;宋雪萌;尹建華;李毅仁;聶禮強 | 申請(專利權(quán))人 | 河鋼集團有限公司 |
代理機構(gòu) | 濟南泉城專利商標(biāo)事務(wù)所 | 代理人 | 支文彬 |
地址 | 250013山東省濟南市歷下區(qū)科院路19號 | ||
法律狀態(tài) | - |
摘要
摘要 | 一種基于多媒體語義解析的監(jiān)控視頻智能預(yù)警方法,通過建立跨模態(tài)語義對齊模型對視頻中所包含的復(fù)雜對象與交互進行準(zhǔn)確理解,并生成視頻片段時空位置圖和視頻語義樹,另一方面,引入基于雙向長短時記憶網(wǎng)絡(luò)的文本編碼模塊,對查詢語句中的文本語義進行深刻理解與表征。實現(xiàn)多模態(tài)特征向共空間的特征映射與融合,并利用語義剪枝策略,粗粒度篩選出精煉的“視頻片段?查詢語句”對,進行細(xì)粒度語義匹配計算,從而確??缒B(tài)視頻定位的精度與效率。 |
