基于掩碼時(shí)域解碼器的實(shí)時(shí)語音降噪方法和裝置

基本信息

申請(qǐng)?zhí)?/td> CN202110299114.0 申請(qǐng)日 -
公開(公告)號(hào) CN113096682A 公開(公告)日 2021-07-09
申請(qǐng)公布號(hào) CN113096682A 申請(qǐng)公布日 2021-07-09
分類號(hào) G10L21/0224(2013.01)I;G10L25/30(2013.01)I 分類 樂器;聲學(xué);
發(fā)明人 李平平 申請(qǐng)(專利權(quán))人 杭州知存智能科技有限公司
代理機(jī)構(gòu) - 代理人 -
地址 311121浙江省杭州市余杭區(qū)倉前街道良睦路1399號(hào)19幢102-9室
法律狀態(tài) -

摘要

摘要 本發(fā)明提供一種基于掩碼時(shí)域解碼器的實(shí)時(shí)語音降噪方法和裝置,該方法包括:將帶噪語音通過Stft提取特征;將提取的特征輸入預(yù)訓(xùn)練的神經(jīng)網(wǎng)絡(luò)得到掩碼mask;將所述掩碼以及所述帶噪語音輸入時(shí)域解碼器進(jìn)行解碼得到增強(qiáng)后的語音,其中,通過將一組加權(quán)函數(shù)(掩碼)應(yīng)用于時(shí)域解碼器來處理帶噪語音實(shí)現(xiàn)基于時(shí)域后處理的實(shí)時(shí)神經(jīng)網(wǎng)絡(luò)降噪,具有顯著較小的模型尺寸和更短的最小等待時(shí)間,使其成為邊緣設(shè)備實(shí)時(shí)降噪的合適解決方案。