一種混合音視頻檢索方法及系統(tǒng)
基本信息
申請?zhí)?/td> | CN201410668366.6 | 申請日 | - |
公開(公告)號 | CN104391924A | 公開(公告)日 | 2015-03-04 |
申請公布號 | CN104391924A | 申請公布日 | 2015-03-04 |
分類號 | G06F17/30(2006.01)I | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 馬展;田海 | 申請(專利權(quán))人 | 南京訊思雅信息科技有限公司 |
代理機(jī)構(gòu) | 南京經(jīng)緯專利商標(biāo)代理有限公司 | 代理人 | 朱小兵 |
地址 | 211100 江蘇省南京市江寧開發(fā)區(qū)將軍大道37號翠屏科創(chuàng)園2號樓1226 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種混合音視頻檢索方法及系統(tǒng),方法包括:步驟(1)將任意視頻數(shù)據(jù)分解成視頻序列和音頻序列;步驟(2)針對視頻序列,通過場景分析提取有限場景幀;步驟(3)在有限場景幀上提取特征點組成表征該場景幀的特征矢量;步驟(4)針對音頻序列,通過使用音頻轉(zhuǎn)文字的算法,將其轉(zhuǎn)換成和音頻時間軸匹配的文字串;步驟(5)根據(jù)音視頻同步時間軸信息將步驟(3)所述場景幀的特征矢量和步驟(4)所述文字串匹配,作為元數(shù)據(jù)附加在原始視頻數(shù)據(jù)頭文件,開放給上層接口檢索。本發(fā)明提出一種混合音視頻檢索系統(tǒng)。本發(fā)明通過綜合視頻特征提取,音頻轉(zhuǎn)文字,文字關(guān)鍵字自動傳遞,將海量視頻數(shù)據(jù)檢索效率和準(zhǔn)確性大大提高。 |
