語音合成模型的訓(xùn)練方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
基本信息
申請(qǐng)?zhí)?/td> | CN202210469094.1 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN114758645A | 公開(公告)日 | 2022-07-15 |
申請(qǐng)公布號(hào) | CN114758645A | 申請(qǐng)公布日 | 2022-07-15 |
分類號(hào) | G10L13/02(2013.01)I;G10L13/047(2013.01)I;G10L25/30(2013.01)I | 分類 | 樂器;聲學(xué); |
發(fā)明人 | 石文玲;楊辰雨 | 申請(qǐng)(專利權(quán))人 | 建信金融科技有限責(zé)任公司 |
代理機(jī)構(gòu) | 北京同立鈞成知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | - |
地址 | 200120上海市自由貿(mào)易試驗(yàn)區(qū)銀城路99號(hào)12層、15層 | ||
法律狀態(tài) | - |
摘要
摘要 | 本申請(qǐng)屬于語音合成領(lǐng)域,具體涉及一種語音合成模型的訓(xùn)練方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)。本申請(qǐng)的語音合成模型的訓(xùn)練方法包括:獲取多組樣本數(shù)據(jù);將待處理數(shù)據(jù)輸入文本分析前端,得到目標(biāo)特征;將目標(biāo)文本特征和目標(biāo)音頻特征輸入聲學(xué)特征預(yù)測模型進(jìn)行聲學(xué)特征預(yù)測,得到樣本文本數(shù)據(jù)對(duì)應(yīng)的目標(biāo)音頻信號(hào);將目標(biāo)音頻信號(hào)輸入聲碼器進(jìn)行音頻合成處理,得到樣本文本數(shù)據(jù)對(duì)應(yīng)的目標(biāo)音頻數(shù)據(jù);根據(jù)目標(biāo)音頻數(shù)據(jù)和標(biāo)準(zhǔn)音頻數(shù)據(jù),調(diào)整語音合成模型的模型參數(shù),得到訓(xùn)練完成的語音合成模型。從而可以實(shí)現(xiàn)提升語音合成的性能的目的。 |
