一種自動拓增語料的語音合成模型訓(xùn)練方法和系統(tǒng)

基本信息

申請?zhí)?/td> CN201910726585.8 申請日 -
公開(公告)號 CN110390928B 公開(公告)日 2022-01-11
申請公布號 CN110390928B 申請公布日 2022-01-11
分類號 G10L13/02(2013.01)I;G10L13/047(2013.01)I;G10L13/08(2013.01)I 分類 樂器;聲學(xué);
發(fā)明人 徐波 申請(專利權(quán))人 廣州多益網(wǎng)絡(luò)股份有限公司
代理機(jī)構(gòu) 廣州三環(huán)專利商標(biāo)代理有限公司 代理人 麥小嬋;郝傳鑫
地址 510530廣東省廣州市蘿崗區(qū)伴河路90號自編一棟301房
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種自動拓增語料的語音合成模型訓(xùn)練方法和系統(tǒng),收集文本?語音平行語料,記為原始語料;將每個語音、文本樣本按照語音停頓分割成若干語音、文本片段,匯集語音、文本片段記為片段語料;構(gòu)建語音合成模型;從原始語料中隨機(jī)選擇m個樣本,將文本、語音樣本分別拼接構(gòu)成新的語料樣本,記為原始構(gòu)造語料;從片段語料中隨機(jī)選擇n個樣本,將文本、語音片段分別拼接構(gòu)成新的語料樣本為片段構(gòu)造語料;使用原始構(gòu)造語料和片段構(gòu)造語料訓(xùn)練語音合成模型;使用原始語料、片段語料和原始構(gòu)造語料繼續(xù)訓(xùn)練,直至得到能夠穩(wěn)定合成語音的語音合成模型。本發(fā)明提高語音合成模型的泛化能力和穩(wěn)健程度,使得能夠合成各種狀況下的文本。