中文語音合成模型訓(xùn)練方法、裝置、電子設(shè)備和存儲(chǔ)介質(zhì)
基本信息
申請(qǐng)?zhí)?/td> | CN202111641722.1 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN114220413A | 公開(公告)日 | 2022-03-22 |
申請(qǐng)公布號(hào) | CN114220413A | 申請(qǐng)公布日 | 2022-03-22 |
分類號(hào) | G10L13/02(2013.01)I;G10L13/08(2013.01)I;G10L13/10(2013.01)I;G10L19/04(2013.01)I;G10L25/18(2013.01)I;G10L25/30(2013.01)I;G06F40/189(2020.01)I | 分類 | 樂器;聲學(xué); |
發(fā)明人 | 付景川 | 申請(qǐng)(專利權(quán))人 | 達(dá)闥機(jī)器人股份有限公司 |
代理機(jī)構(gòu) | 北京智晨知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | 張婧 |
地址 | 200245上海市閔行區(qū)中青路207號(hào)8幢 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明涉及人工智能領(lǐng)域,公開了一種中文語音合成模型的訓(xùn)練方法、裝置、電子設(shè)備和存儲(chǔ)介質(zhì)。本發(fā)明中,該中文語音合成模型的訓(xùn)練方法,包括:提取預(yù)設(shè)中文語音數(shù)據(jù)集中每條中文語音的音素信息、音調(diào)信息和梅爾譜;其中,音調(diào)信息中的每個(gè)音調(diào)元素為音素信息中的音素元素對(duì)應(yīng)的音調(diào);基于預(yù)設(shè)算法訓(xùn)練預(yù)設(shè)的學(xué)習(xí)模型,并將訓(xùn)練完成的學(xué)習(xí)模型作為中文語音合成模型;其中,學(xué)習(xí)模型的訓(xùn)練數(shù)據(jù)包括提取的音素信息、音調(diào)信息和梅爾譜。能夠提高中文語音合成模型的準(zhǔn)確度,降低中文語音合成時(shí)出現(xiàn)音調(diào)錯(cuò)誤的概率。 |
