一種多媒體采集裝置和方法

基本信息

申請(qǐng)?zhí)?/td> CN201210283273.2 申請(qǐng)日 -
公開(公告)號(hào) CN103581606A 公開(公告)日 2014-02-12
申請(qǐng)公布號(hào) CN103581606A 申請(qǐng)公布日 2014-02-12
分類號(hào) H04N7/14(2006.01)I;H04N7/15(2006.01)I;H04N5/232(2006.01)I;G10L15/06(2013.01)I 分類 電通信技術(shù);
發(fā)明人 孫敏剛;趙照 申請(qǐng)(專利權(quán))人 北京維鯨視界科技有限公司
代理機(jī)構(gòu) - 代理人 -
地址 100080 北京市海淀區(qū)知春路51號(hào)慎昌大廈5026室
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種多媒體采集裝置和方法,屬于多媒體領(lǐng)域。裝置包括:音頻采集單元,包括至少四個(gè)采集通道,用于采集發(fā)言者的發(fā)出的音頻信號(hào);音頻分析單元,用于將采集到的發(fā)言者的音頻信號(hào)中的特征量在預(yù)置的語音模型中進(jìn)行匹配分析,實(shí)時(shí)定位發(fā)言者的位置信息;視頻同步單元,用于根據(jù)發(fā)言者的位置信息實(shí)時(shí)調(diào)整攝像頭,從而使攝像頭采集含有發(fā)言者的視頻信號(hào)。本發(fā)明通過至少四通道對(duì)外部音場(chǎng)進(jìn)行檢測(cè)采集,并基于語音模型對(duì)所得的音場(chǎng)環(huán)境中的當(dāng)前發(fā)言者進(jìn)行跟蹤,則得出發(fā)言者的相對(duì)位置并實(shí)時(shí)調(diào)整攝像頭進(jìn)行音頻和視頻同步采集;且四個(gè)采集通道均衡設(shè)置,攝像頭轉(zhuǎn)動(dòng)靈活,也通過多個(gè)通道擴(kuò)大了音頻采集的范圍,從而采集立體效果的音頻質(zhì)量。