基于生成對抗網(wǎng)絡(luò)的語音增強方法及系統(tǒng)

基本信息

申請?zhí)?/td> CN202210301250.3 申請日 -
公開(公告)號 CN114664318A 公開(公告)日 2022-06-24
申請公布號 CN114664318A 申請公布日 2022-06-24
分類號 G10L21/0208(2013.01)I;G10L25/30(2013.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I 分類 樂器;聲學(xué);
發(fā)明人 汪付強;袁從剛;夏源;張鵬;吳曉明;張建強;劉祥志;郝秋赟;馬曉鳳 申請(專利權(quán))人 山東省計算中心(國家超級計算濟南中心)
代理機構(gòu) 濟南圣達知識產(chǎn)權(quán)代理有限公司 代理人 -
地址 250014山東省濟南市歷下區(qū)科院路19號
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了基于生成對抗網(wǎng)絡(luò)的語音增強方法及系統(tǒng),包括:獲取帶噪聲語音信號;將帶噪聲語音信號,輸入到訓(xùn)練后的生成對抗網(wǎng)絡(luò)中,輸出增強后的語音信號;其中,所述生成對抗網(wǎng)絡(luò),包括兩個生成器和兩個判別器;所述生成對抗網(wǎng)絡(luò),訓(xùn)練過程中通過對兩個生成器與兩個判別器的相互博弈,提升生成器逼近目標(biāo)信號的能力。本發(fā)明充分考慮了語音信號的時序關(guān)系,改進了先前的生成器與判別器的全卷積的設(shè)計,生成器中添加使用多頭注意力機制,并將多生成器多階段增強與注意力機制相結(jié)合,充分利用了多頭注意力機制與生成對抗網(wǎng)絡(luò)博弈思想。本方法能夠是增強后的語音具有更高的質(zhì)量與可懂度。