一種語音處理方法、裝置、電子設(shè)備和計算機存儲介質(zhì)

基本信息

申請?zhí)?/td> CN202110546236.5 申請日 -
公開(公告)號 CN113393854A 公開(公告)日 2021-09-14
申請公布號 CN113393854A 申請公布日 2021-09-14
分類號 G10L21/0208(2013.01)I;G10L21/0216(2013.01)I;G10L21/0224(2013.01)I;G10L25/30(2013.01)I 分類 樂器;聲學;
發(fā)明人 汪劍;李志飛 申請(專利權(quán))人 出門問問信息科技有限公司
代理機構(gòu) 北京樂知新創(chuàng)知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 周偉
地址 100044北京市海淀區(qū)高梁橋斜街42號院1號樓-1層-101
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種語音處理方法,包括:構(gòu)建第一語音數(shù)據(jù)和第二語音數(shù)據(jù)的訓練對;將第一語音數(shù)據(jù)和第二語音數(shù)據(jù)的原始特征分別輸入生成模型,生成與第一語音數(shù)據(jù)對應(yīng)的第一嵌入數(shù)據(jù)、及與第二語音數(shù)據(jù)對應(yīng)的第二嵌入數(shù)據(jù);將第一嵌入數(shù)據(jù)和第二嵌入數(shù)據(jù)輸入判別模型進行訓練,獲得判別結(jié)果;根據(jù)判別模型,用隨機梯度下降的方式進行對抗模型學習,獲得語音降噪模型;根據(jù)語音降噪模型對目標語音數(shù)據(jù)進行降噪處理。本發(fā)明在保證其魯棒性、在對先驗知識依賴比較少的前提下,利用深度學習網(wǎng)絡(luò)自適應(yīng)的去充分學習正常信號和噪音信號之間的關(guān)聯(lián)性和差異性,實現(xiàn)較好的語音降噪效果。