一種基于深度學(xué)習(xí)的空中管制語音降噪方法

基本信息

申請?zhí)?/td> CN202110413991.6 申請日 -
公開(公告)號 CN113129919A 公開(公告)日 2021-07-16
申請公布號 CN113129919A 申請公布日 2021-07-16
分類號 G10L21/0208(2013.01)I;G10L21/0224(2013.01)I;G10L21/0232(2013.01)I;G06N3/08(2006.01)I;G06N3/04(2006.01)I 分類 樂器;聲學(xué);
發(fā)明人 顧毅陶;李鑫;王宏鋒 申請(專利權(quán))人 上海麥圖信息科技有限公司
代理機(jī)構(gòu) - 代理人 -
地址 200000上海市徐匯區(qū)桂平路680號32幢527-1室
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種基于深度學(xué)習(xí)的空中管制語音降噪方法,步驟如下:獲取待降噪音頻,將其轉(zhuǎn)換為16bit/16kHz的PCM音頻數(shù)據(jù),并通過短時(shí)傅里葉變換由時(shí)域轉(zhuǎn)換為頻域;建立深度網(wǎng)絡(luò)模型;建立空管音頻訓(xùn)練數(shù)據(jù)集和標(biāo)簽數(shù)據(jù)集;利用訓(xùn)練數(shù)據(jù)訓(xùn)練深度網(wǎng)絡(luò)模型得到降噪模型;待降噪音頻經(jīng)短時(shí)傅里葉變換后輸入到降噪模型,并與短時(shí)傅里葉變換分離得到的相位信息進(jìn)行點(diǎn)積操作,然后通過逆短時(shí)傅里葉變換生成降噪音頻。本發(fā)明深度網(wǎng)絡(luò)模型使用帶有長連接的Encoder?Decoder模型來進(jìn)行特征提取,并且通過1X1卷積核對提取的特征數(shù)據(jù)進(jìn)行處理,生成降噪語音。本發(fā)明具有極強(qiáng)的降噪能力和泛化能力,降噪后的音頻能保留較高的信噪比。