一種基于變分自編碼器的聲碼器實(shí)現(xiàn)方法及裝置

基本信息

申請(qǐng)?zhí)?/td> CN202010541602.3 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN111724809A 公開(kāi)(公告)日 2020-09-29
申請(qǐng)公布號(hào) CN111724809A 申請(qǐng)公布日 2020-09-29
分類號(hào) G10L25/24(2013.01)I 分類 樂(lè)器;聲學(xué);
發(fā)明人 劉雨松 申請(qǐng)(專利權(quán))人 蘇州意能通信息技術(shù)有限公司
代理機(jī)構(gòu) 江蘇昆成律師事務(wù)所 代理人 蘇州意能通信息技術(shù)有限公司
地址 215000江蘇省蘇州市工業(yè)園區(qū)若水路388號(hào)E0202室
法律狀態(tài) -

摘要

摘要 為了解決現(xiàn)有技術(shù)采用自回歸方式的音頻生成效率低的問(wèn)題,提供一種基于變分自編碼器的聲碼器實(shí)現(xiàn)方法及裝置,包括訓(xùn)練過(guò)程和應(yīng)用過(guò)程,其特征在于,訓(xùn)練過(guò)程包括步驟:將音頻源信號(hào)輸入預(yù)處理模塊,得到梅爾譜圖;再將梅爾譜圖輸入條件信息模塊,得到條件信息;再將條件信息和音頻源信號(hào)共同輸入編碼器中,得到中間隱藏信息;再將中間隱藏信息和條件信息共同輸入解碼器中,得到輸出音頻;進(jìn)行損失函數(shù)計(jì)算并進(jìn)行參數(shù)優(yōu)化,當(dāng)總損失函數(shù)值低于某個(gè)閾值,訓(xùn)練完成;應(yīng)用過(guò)程包括步驟:將前端得到的頻譜圖輸入條件信息模塊得到條件信息,將條件信息和已知的標(biāo)準(zhǔn)高斯白噪聲輸入解碼器,得到輸出音頻。??