一種基于變分自編碼器的聲碼器實(shí)現(xiàn)方法及裝置
基本信息
申請(qǐng)?zhí)?/td> | CN202010541602.3 | 申請(qǐng)日 | - |
公開(kāi)(公告)號(hào) | CN111724809A | 公開(kāi)(公告)日 | 2020-09-29 |
申請(qǐng)公布號(hào) | CN111724809A | 申請(qǐng)公布日 | 2020-09-29 |
分類號(hào) | G10L25/24(2013.01)I | 分類 | 樂(lè)器;聲學(xué); |
發(fā)明人 | 劉雨松 | 申請(qǐng)(專利權(quán))人 | 蘇州意能通信息技術(shù)有限公司 |
代理機(jī)構(gòu) | 江蘇昆成律師事務(wù)所 | 代理人 | 蘇州意能通信息技術(shù)有限公司 |
地址 | 215000江蘇省蘇州市工業(yè)園區(qū)若水路388號(hào)E0202室 | ||
法律狀態(tài) | - |
摘要
摘要 | 為了解決現(xiàn)有技術(shù)采用自回歸方式的音頻生成效率低的問(wèn)題,提供一種基于變分自編碼器的聲碼器實(shí)現(xiàn)方法及裝置,包括訓(xùn)練過(guò)程和應(yīng)用過(guò)程,其特征在于,訓(xùn)練過(guò)程包括步驟:將音頻源信號(hào)輸入預(yù)處理模塊,得到梅爾譜圖;再將梅爾譜圖輸入條件信息模塊,得到條件信息;再將條件信息和音頻源信號(hào)共同輸入編碼器中,得到中間隱藏信息;再將中間隱藏信息和條件信息共同輸入解碼器中,得到輸出音頻;進(jìn)行損失函數(shù)計(jì)算并進(jìn)行參數(shù)優(yōu)化,當(dāng)總損失函數(shù)值低于某個(gè)閾值,訓(xùn)練完成;應(yīng)用過(guò)程包括步驟:將前端得到的頻譜圖輸入條件信息模塊得到條件信息,將條件信息和已知的標(biāo)準(zhǔn)高斯白噪聲輸入解碼器,得到輸出音頻。?? |
