語音合成模型的訓(xùn)練方法、裝置、設(shè)備及存儲介質(zhì)
基本信息
申請?zhí)?/td> | CN202210469094.1 | 申請日 | - |
公開(公告)號 | CN114758645A | 公開(公告)日 | 2022-07-15 |
申請公布號 | CN114758645A | 申請公布日 | 2022-07-15 |
分類號 | G10L13/02(2013.01)I;G10L13/047(2013.01)I;G10L25/30(2013.01)I | 分類 | 樂器;聲學(xué); |
發(fā)明人 | 石文玲;楊辰雨 | 申請(專利權(quán))人 | 建信金融科技有限責(zé)任公司 |
代理機構(gòu) | 北京同立鈞成知識產(chǎn)權(quán)代理有限公司 | 代理人 | - |
地址 | 200120上海市自由貿(mào)易試驗區(qū)銀城路99號12層、15層 | ||
法律狀態(tài) | - |
摘要
摘要 | 本申請屬于語音合成領(lǐng)域,具體涉及一種語音合成模型的訓(xùn)練方法、裝置、設(shè)備及存儲介質(zhì)。本申請的語音合成模型的訓(xùn)練方法包括:獲取多組樣本數(shù)據(jù);將待處理數(shù)據(jù)輸入文本分析前端,得到目標(biāo)特征;將目標(biāo)文本特征和目標(biāo)音頻特征輸入聲學(xué)特征預(yù)測模型進行聲學(xué)特征預(yù)測,得到樣本文本數(shù)據(jù)對應(yīng)的目標(biāo)音頻信號;將目標(biāo)音頻信號輸入聲碼器進行音頻合成處理,得到樣本文本數(shù)據(jù)對應(yīng)的目標(biāo)音頻數(shù)據(jù);根據(jù)目標(biāo)音頻數(shù)據(jù)和標(biāo)準(zhǔn)音頻數(shù)據(jù),調(diào)整語音合成模型的模型參數(shù),得到訓(xùn)練完成的語音合成模型。從而可以實現(xiàn)提升語音合成的性能的目的。 |
