一種提升視頻會議系統(tǒng)混音容量的方法
基本信息
申請?zhí)?/td> | CN201610191335.5 | 申請日 | - |
公開(公告)號 | CN105743911A | 公開(公告)日 | 2016-07-06 |
申請公布號 | CN105743911A | 申請公布日 | 2016-07-06 |
分類號 | H04L29/06(2006.01)I;H04N7/15(2006.01)I;H04N5/222(2006.01)I | 分類 | 電通信技術(shù); |
發(fā)明人 | 邊學(xué)工;唐雪華;王中元;鄧亮;汪亞洲 | 申請(專利權(quán))人 | 武漢隨銳億山科技有限公司 |
代理機構(gòu) | 武漢科皓知識產(chǎn)權(quán)代理事務(wù)所(特殊普通合伙) | 代理人 | 魏波 |
地址 | 430070 湖北省武漢市東湖高新技術(shù)開發(fā)區(qū)大學(xué)園路5-2號國家地球空間信息產(chǎn)業(yè)基地二期北主樓二單元 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種提升視頻會議系統(tǒng)混音容量的方法,借助opus碼流中嵌入的語音活動狀態(tài)標識,將壓縮語音區(qū)分為活動語音和非活動語音,在網(wǎng)絡(luò)接收階段直接拋棄非活動語音,從而省掉了后續(xù)的解碼和混音運算。具體步驟包括:從接收的opus編碼語音幀中提取語音活動標記VAD,VAD標記分0、1、2三種值,分別指示非活動語音、活動語音、無法判斷三種情況;對判斷為非活動語音的opus幀在網(wǎng)絡(luò)接收層選擇性丟棄,同時修改后續(xù)的RTP包參數(shù);當(dāng)混音器輸入語音緩沖區(qū)出現(xiàn)下溢時,填充靜音幀,同時對靜音幀的VAD標記和能量參數(shù)賦值。采用本發(fā)明方法可簡化視頻會議系統(tǒng)中混音運算步驟,從而大幅度提高混音容量,同時未給基于opus的互聯(lián)互通帶來不利影響。 |
