一種基于生成對抗網(wǎng)絡(luò)的語音增強(qiáng)方法
基本信息
申請?zhí)?/td> | CN201910696224.3 | 申請日 | - |
公開(公告)號 | CN110428849B | 公開(公告)日 | 2021-10-08 |
申請公布號 | CN110428849B | 申請公布日 | 2021-10-08 |
分類號 | G10L21/0208;G10L21/0216;G10L25/03;G10L25/30 | 分類 | 樂器;聲學(xué); |
發(fā)明人 | 殷緒成;趙力;楊春 | 申請(專利權(quán))人 | 珠海億智電子科技有限公司 |
代理機(jī)構(gòu) | 廣州科粵專利商標(biāo)代理有限公司 | 代理人 | 鄧潮彬;黃培智 |
地址 | 519080 廣東省珠海市高新區(qū)唐家灣鎮(zhèn)港樂路8號大洲科技園B區(qū)905 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種基于生成對抗網(wǎng)絡(luò)的語音增強(qiáng)方法,其特征在于,包括以下步驟:步驟1、采用漸進(jìn)式訓(xùn)練方式,重建純凈語音的分布;步驟2、采用基于判別器的特征匹配策略,優(yōu)化生成器的增強(qiáng)性能;步驟3、采用若干種噪聲類型數(shù)據(jù)進(jìn)行訓(xùn)練,以生成對抗網(wǎng)絡(luò)。本發(fā)明將基于判別器的特征匹配與傳統(tǒng)的特征映射方法相結(jié)合,有效減少了增強(qiáng)后語音的特征分布與純凈語音特征分布的差異。此外,還采用GAN目標(biāo)函數(shù)對網(wǎng)絡(luò)進(jìn)行了聯(lián)合優(yōu)化訓(xùn)練,使生成器和判別器之間的損失達(dá)到最小。 |
