基于生成對抗網(wǎng)絡(luò)的語音增強方法及系統(tǒng)
基本信息
申請?zhí)?/td> | CN202210301250.3 | 申請日 | - |
公開(公告)號 | CN114664318A | 公開(公告)日 | 2022-06-24 |
申請公布號 | CN114664318A | 申請公布日 | 2022-06-24 |
分類號 | G10L21/0208(2013.01)I;G10L25/30(2013.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I | 分類 | 樂器;聲學(xué); |
發(fā)明人 | 汪付強;袁從剛;夏源;張鵬;吳曉明;張建強;劉祥志;郝秋赟;馬曉鳳 | 申請(專利權(quán))人 | 山東省計算中心(國家超級計算濟南中心) |
代理機構(gòu) | 濟南圣達知識產(chǎn)權(quán)代理有限公司 | 代理人 | - |
地址 | 250014山東省濟南市歷下區(qū)科院路19號 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了基于生成對抗網(wǎng)絡(luò)的語音增強方法及系統(tǒng),包括:獲取帶噪聲語音信號;將帶噪聲語音信號,輸入到訓(xùn)練后的生成對抗網(wǎng)絡(luò)中,輸出增強后的語音信號;其中,所述生成對抗網(wǎng)絡(luò),包括兩個生成器和兩個判別器;所述生成對抗網(wǎng)絡(luò),訓(xùn)練過程中通過對兩個生成器與兩個判別器的相互博弈,提升生成器逼近目標(biāo)信號的能力。本發(fā)明充分考慮了語音信號的時序關(guān)系,改進了先前的生成器與判別器的全卷積的設(shè)計,生成器中添加使用多頭注意力機制,并將多生成器多階段增強與注意力機制相結(jié)合,充分利用了多頭注意力機制與生成對抗網(wǎng)絡(luò)博弈思想。本方法能夠是增強后的語音具有更高的質(zhì)量與可懂度。 |
