語(yǔ)音合成模型的訓(xùn)練與語(yǔ)音合成方法、裝置、系統(tǒng)及介質(zhì)

基本信息

申請(qǐng)?zhí)?/td> CN202110452252.8 申請(qǐng)日 -
公開(公告)號(hào) CN113241056A 公開(公告)日 2021-08-10
申請(qǐng)公布號(hào) CN113241056A 申請(qǐng)公布日 2021-08-10
分類號(hào) G10L13/047(2013.01)I;G10L13/08(2013.01)I;G10L25/51(2013.01)I;G01H17/00(2006.01)I;H04L29/08(2006.01)I 分類 樂器;聲學(xué);
發(fā)明人 李世龍;鐘彩桂;李秀林 申請(qǐng)(專利權(quán))人 標(biāo)貝(北京)科技有限公司
代理機(jī)構(gòu) 北京睿邦知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 徐丁峰;戴亞南
地址 100192北京市海淀區(qū)西小口路66號(hào)中關(guān)村東升科技園·北領(lǐng)地B-2號(hào)樓2層A203A(東升地區(qū))
法律狀態(tài) -

摘要

摘要 本發(fā)明提供一種個(gè)性化語(yǔ)音合成模型的訓(xùn)練方法、裝置、系統(tǒng)及存儲(chǔ)介質(zhì)與一種語(yǔ)音合成方法、裝置、系統(tǒng)及存儲(chǔ)介質(zhì)。訓(xùn)練方法包括:接收復(fù)刻客戶端直接或經(jīng)由復(fù)刻業(yè)務(wù)服務(wù)器發(fā)送的目標(biāo)用戶的用戶錄音文件;調(diào)度容器集群中的動(dòng)態(tài)新增的特定計(jì)算節(jié)點(diǎn);通過特定計(jì)算節(jié)點(diǎn)從鏡像倉(cāng)庫(kù)中拉取訓(xùn)練鏡像,其中,訓(xùn)練鏡像通過打包標(biāo)準(zhǔn)語(yǔ)音合成模型的訓(xùn)練環(huán)境生成,標(biāo)準(zhǔn)語(yǔ)音合成模型基于樣本錄音文件和對(duì)應(yīng)的樣本文本進(jìn)行訓(xùn)練;在特定計(jì)算節(jié)點(diǎn)上運(yùn)行訓(xùn)練鏡像以展開訓(xùn)練環(huán)境;在特定計(jì)算節(jié)點(diǎn)上利用訓(xùn)練環(huán)境和用戶錄音文件進(jìn)行語(yǔ)音合成模型訓(xùn)練,以獲得專屬于目標(biāo)用戶的個(gè)性化語(yǔ)音合成模型??蓪?shí)現(xiàn)模型訓(xùn)練時(shí)的計(jì)算力的自動(dòng)擴(kuò)展,可支持大規(guī)模的自動(dòng)化訓(xùn)練任務(wù)。