一種融合骨振動(dòng)傳感器和麥克風(fēng)信號(hào)的深度學(xué)習(xí)語音提取和降噪方法

基本信息

申請?zhí)?/td> PCT/CN2019/110080 申請日 -
公開(公告)號(hào) WO2021068120A1 公開(公告)日 2021-04-15
申請公布號(hào) WO2021068120A1 申請公布日 2021-04-15
分類號(hào) G10L21/0208 分類 樂器;聲學(xué);
發(fā)明人 YAN, YONGJIE;閆永杰 申請(專利權(quán))人 大象聲科(深圳)科技有限公司
代理機(jī)構(gòu) - 代理人 SHENZHEN KUAIMA PATENT & TRADEMARK OFFICE;深圳快馬專利商標(biāo)事務(wù)所(普通合伙)
地址 533, Bld.12, Shenzhen Bay Science and Technology Ecological Park,No.18, Keji South Rd, High-Tech Zone, Yuehai Dist., Nanshan Dist.,Shenzhen, Guangdong 518000 CN
法律狀態(tài) -

摘要

摘要 一種融合骨振動(dòng)傳感器和麥克風(fēng)信號(hào)的深度學(xué)習(xí)降噪方法,包括如下步驟:S1骨振動(dòng)傳感器和麥克風(fēng)采集音頻信號(hào),分別得到骨振動(dòng)傳感器音頻信號(hào)和麥克風(fēng)音頻信號(hào);S2將骨振動(dòng)傳感器音頻信號(hào)輸入高通濾波模塊,并進(jìn)行高通濾波;S3將經(jīng)過高通濾波后的骨振動(dòng)傳感器音頻信號(hào)或經(jīng)過頻帶拓寬后的信號(hào),與麥克風(fēng)音頻信號(hào)輸入深度神經(jīng)網(wǎng)絡(luò)模塊;S4深度神經(jīng)網(wǎng)絡(luò)模塊經(jīng)過預(yù)測得出融合降噪后的語音。該方法結(jié)合了骨震動(dòng)傳感器以及傳統(tǒng)麥克風(fēng)的信號(hào),利用深度神經(jīng)網(wǎng)絡(luò)強(qiáng)大的建模能力實(shí)現(xiàn)了很高的人聲還原度及極強(qiáng)的噪聲抑制能力,可以解決復(fù)雜噪聲場景下的人聲提取問題,實(shí)現(xiàn)提取目標(biāo)人聲,降低干擾噪聲,并可采用單麥克風(fēng)結(jié)構(gòu)減少成本。還可將骨振動(dòng)傳感器音頻信號(hào)經(jīng)過頻帶拓寬后的信號(hào)直接作為輸出。