基于音視頻分析的網(wǎng)絡(luò)通話麥克風(fēng)狀態(tài)提示方法及系統(tǒng)

基本信息

申請?zhí)?/td> CN202010346498.2 申請日 -
公開(公告)號 CN111510662A 公開(公告)日 2021-06-22
申請公布號 CN111510662A 申請公布日 2021-06-22
分類號 H04N7/15;H04M3/56;H04R3/00;G10L25/51;G10L25/78 分類 電通信技術(shù);
發(fā)明人 趙清明;宋少鵬;黃生柏;張清 申請(專利權(quán))人 深圳米唐科技有限公司
代理機(jī)構(gòu) 深圳信科專利代理事務(wù)所(普通合伙) 代理人 吳軍
地址 518000 廣東省深圳市寶安區(qū)新安街道興東社區(qū)72區(qū)留仙三路36號3002室
法律狀態(tài) -

摘要

摘要 本發(fā)明提供一種基于音視頻分析的網(wǎng)絡(luò)通話麥克風(fēng)狀態(tài)提示方法及系統(tǒng),包括以下步驟:S1、確定終端麥克風(fēng)是否處于靜音狀態(tài);S2、根據(jù)用戶說話狀態(tài)發(fā)出取消或設(shè)置麥克風(fēng)靜音狀態(tài)的提示;S3、對通話遠(yuǎn)端信號進(jìn)行VAD檢測,如檢測到通話遠(yuǎn)端信號為無效信號,則判定揚(yáng)聲器空閑,則播放第一提示或第二提示;S4、在播放所述提示時,如檢測到通話遠(yuǎn)端信號為有效信號,則停止所述第一提示或者第二提示的播報、或把所述第一提示或第二提示與通話遠(yuǎn)端信號混音處理后播報。本發(fā)明根據(jù)用戶面部動作識別結(jié)果和語音信號聲紋識別結(jié)果判斷用戶說話狀態(tài),實(shí)時提示用戶打開或關(guān)閉麥克風(fēng)。