一種多媒體采集裝置和方法

基本信息

申請?zhí)?/td> CN201210283273.2 申請日 -
公開(公告)號 CN103581606B 公開(公告)日 2018-09-07
申請公布號 CN103581606B 申請公布日 2018-09-07
分類號 H04N7/14;H04N7/15;H04N5/232;G10L15/06 分類 電通信技術(shù);
發(fā)明人 孫敏剛;趙照 申請(專利權(quán))人 北京維鯨視界科技有限公司
代理機構(gòu) 北京市隆安律師事務(wù)所 代理人 北京維鯨視界科技有限公司
地址 100085 北京市海淀區(qū)上地三街9號C座C612
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種多媒體采集裝置和方法,屬于多媒體領(lǐng)域。裝置包括:音頻采集單元,包括至少四個采集通道,用于采集發(fā)言者的發(fā)出的音頻信號;音頻分析單元,用于將采集到的發(fā)言者的音頻信號中的特征量在預(yù)置的語音模型中進行匹配分析,實時定位發(fā)言者的位置信息;視頻同步單元,用于根據(jù)發(fā)言者的位置信息實時調(diào)整攝像頭,從而使攝像頭采集含有發(fā)言者的視頻信號。本發(fā)明通過至少四通道對外部音場進行檢測采集,并基于語音模型對所得的音場環(huán)境中的當(dāng)前發(fā)言者進行跟蹤,則得出發(fā)言者的相對位置并實時調(diào)整攝像頭進行音頻和視頻同步采集;且四個采集通道均衡設(shè)置,攝像頭轉(zhuǎn)動靈活,也通過多個通道擴大了音頻采集的范圍,從而采集立體效果的音頻質(zhì)量。