基于掩碼時域解碼器的實時語音降噪方法和裝置
基本信息
申請?zhí)?/td> | CN202110299114.0 | 申請日 | - |
公開(公告)號 | CN113096682A | 公開(公告)日 | 2021-07-09 |
申請公布號 | CN113096682A | 申請公布日 | 2021-07-09 |
分類號 | G10L21/0224(2013.01)I;G10L25/30(2013.01)I | 分類 | 樂器;聲學; |
發(fā)明人 | 李平平 | 申請(專利權)人 | 杭州知存智能科技有限公司 |
代理機構 | - | 代理人 | - |
地址 | 311121浙江省杭州市余杭區(qū)倉前街道良睦路1399號19幢102-9室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明提供一種基于掩碼時域解碼器的實時語音降噪方法和裝置,該方法包括:將帶噪語音通過Stft提取特征;將提取的特征輸入預訓練的神經(jīng)網(wǎng)絡得到掩碼mask;將所述掩碼以及所述帶噪語音輸入時域解碼器進行解碼得到增強后的語音,其中,通過將一組加權函數(shù)(掩碼)應用于時域解碼器來處理帶噪語音實現(xiàn)基于時域后處理的實時神經(jīng)網(wǎng)絡降噪,具有顯著較小的模型尺寸和更短的最小等待時間,使其成為邊緣設備實時降噪的合適解決方案。 |
