一種基于深度學(xué)習(xí)的空中管制語音降噪方法
基本信息
申請?zhí)?/td> | CN202110413991.6 | 申請日 | - |
公開(公告)號 | CN113129919A | 公開(公告)日 | 2021-07-16 |
申請公布號 | CN113129919A | 申請公布日 | 2021-07-16 |
分類號 | G10L21/0208(2013.01)I;G10L21/0224(2013.01)I;G10L21/0232(2013.01)I;G06N3/08(2006.01)I;G06N3/04(2006.01)I | 分類 | 樂器;聲學(xué); |
發(fā)明人 | 顧毅陶;李鑫;王宏鋒 | 申請(專利權(quán))人 | 上海麥圖信息科技有限公司 |
代理機(jī)構(gòu) | - | 代理人 | - |
地址 | 200000上海市徐匯區(qū)桂平路680號32幢527-1室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種基于深度學(xué)習(xí)的空中管制語音降噪方法,步驟如下:獲取待降噪音頻,將其轉(zhuǎn)換為16bit/16kHz的PCM音頻數(shù)據(jù),并通過短時(shí)傅里葉變換由時(shí)域轉(zhuǎn)換為頻域;建立深度網(wǎng)絡(luò)模型;建立空管音頻訓(xùn)練數(shù)據(jù)集和標(biāo)簽數(shù)據(jù)集;利用訓(xùn)練數(shù)據(jù)訓(xùn)練深度網(wǎng)絡(luò)模型得到降噪模型;待降噪音頻經(jīng)短時(shí)傅里葉變換后輸入到降噪模型,并與短時(shí)傅里葉變換分離得到的相位信息進(jìn)行點(diǎn)積操作,然后通過逆短時(shí)傅里葉變換生成降噪音頻。本發(fā)明深度網(wǎng)絡(luò)模型使用帶有長連接的Encoder?Decoder模型來進(jìn)行特征提取,并且通過1X1卷積核對提取的特征數(shù)據(jù)進(jìn)行處理,生成降噪語音。本發(fā)明具有極強(qiáng)的降噪能力和泛化能力,降噪后的音頻能保留較高的信噪比。 |
