語音合成模型的訓(xùn)練方法、裝置、設(shè)備及存儲介質(zhì)

基本信息

申請?zhí)?/td> CN202210469094.1 申請日 -
公開(公告)號 CN114758645A 公開(公告)日 2022-07-15
申請公布號 CN114758645A 申請公布日 2022-07-15
分類號 G10L13/02(2013.01)I;G10L13/047(2013.01)I;G10L25/30(2013.01)I 分類 樂器;聲學(xué);
發(fā)明人 石文玲;楊辰雨 申請(專利權(quán))人 建信金融科技有限責(zé)任公司
代理機構(gòu) 北京同立鈞成知識產(chǎn)權(quán)代理有限公司 代理人 -
地址 200120上海市自由貿(mào)易試驗區(qū)銀城路99號12層、15層
法律狀態(tài) -

摘要

摘要 本申請屬于語音合成領(lǐng)域,具體涉及一種語音合成模型的訓(xùn)練方法、裝置、設(shè)備及存儲介質(zhì)。本申請的語音合成模型的訓(xùn)練方法包括:獲取多組樣本數(shù)據(jù);將待處理數(shù)據(jù)輸入文本分析前端,得到目標(biāo)特征;將目標(biāo)文本特征和目標(biāo)音頻特征輸入聲學(xué)特征預(yù)測模型進行聲學(xué)特征預(yù)測,得到樣本文本數(shù)據(jù)對應(yīng)的目標(biāo)音頻信號;將目標(biāo)音頻信號輸入聲碼器進行音頻合成處理,得到樣本文本數(shù)據(jù)對應(yīng)的目標(biāo)音頻數(shù)據(jù);根據(jù)目標(biāo)音頻數(shù)據(jù)和標(biāo)準(zhǔn)音頻數(shù)據(jù),調(diào)整語音合成模型的模型參數(shù),得到訓(xùn)練完成的語音合成模型。從而可以實現(xiàn)提升語音合成的性能的目的。