音頻生成方法以及相關(guān)模型的訓(xùn)練方法和相關(guān)裝置
基本信息
申請(qǐng)?zhí)?/td> | CN202111491439.5 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN114420083A | 公開(公告)日 | 2022-04-29 |
申請(qǐng)公布號(hào) | CN114420083A | 申請(qǐng)公布日 | 2022-04-29 |
分類號(hào) | G10L13/02(2013.01)I;G10L13/033(2013.01)I;G10L13/04(2013.01)I;G10L13/08(2013.01)I | 分類 | 樂器;聲學(xué); |
發(fā)明人 | 陳夢(mèng)楠;高麗;祖漪清;江源 | 申請(qǐng)(專利權(quán))人 | 西安訊飛超腦信息科技有限公司 |
代理機(jī)構(gòu) | 深圳市威世博知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) | 代理人 | 劉希 |
地址 | 710000陜西省西安市高新區(qū)西安高新區(qū)軟件新城天谷八路156號(hào)云匯谷D座101 | ||
法律狀態(tài) | - |
摘要
摘要 | 本申請(qǐng)公開了一種音頻生成方法以及相關(guān)模型的訓(xùn)練方法和相關(guān)裝置、設(shè)備,其中,該音頻生成方法包括:對(duì)目標(biāo)文本進(jìn)行目標(biāo)口音的文本編碼,得到目標(biāo)口音的目標(biāo)文本編碼向量;對(duì)目標(biāo)文本編碼向量與目標(biāo)音色對(duì)應(yīng)的目標(biāo)音色向量進(jìn)行解碼處理,以得到與目標(biāo)音色對(duì)應(yīng)的若干時(shí)刻的目標(biāo)子頻譜;對(duì)若干時(shí)刻的目標(biāo)子頻譜進(jìn)行合成處理,得到目標(biāo)文本對(duì)應(yīng)的目標(biāo)合成頻譜。通過(guò)上述方式,能夠利用文本實(shí)現(xiàn)生成指定音色和指定口音的音頻。另外,還可以利用音色判別器對(duì)基于目標(biāo)文本生成目標(biāo)口音、目標(biāo)音色的音頻的頻譜的轉(zhuǎn)換模型進(jìn)行訓(xùn)練,能夠使得經(jīng)訓(xùn)練的轉(zhuǎn)換模型生成的合成頻譜的音色與指定音色趨向一致,提高模型轉(zhuǎn)換的準(zhǔn)確性。 |
