用于語音合成模型訓(xùn)練的交互方法、裝置、系統(tǒng)及介質(zhì)
基本信息
申請?zhí)?/td> | CN202110452288.6 | 申請日 | - |
公開(公告)號 | CN113241057A | 公開(公告)日 | 2021-08-10 |
申請公布號 | CN113241057A | 申請公布日 | 2021-08-10 |
分類號 | G10L13/047(2013.01)I;G10L13/08(2013.01)I;G10L25/51(2013.01)I;G01H17/00(2006.01)I;H04L29/08(2006.01)I | 分類 | 樂器;聲學(xué); |
發(fā)明人 | 胡帥君;邊會康;李世龍;李秀林 | 申請(專利權(quán))人 | 標(biāo)貝(北京)科技有限公司 |
代理機(jī)構(gòu) | 北京睿邦知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) | 代理人 | 徐丁峰;戴亞南 |
地址 | 100192北京市海淀區(qū)西小口路66號中關(guān)村東升科技園·北領(lǐng)地B-2號樓2層A203A(東升地區(qū)) | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明提供一種用于實現(xiàn)個性化語音合成模型訓(xùn)練的交互方法、裝置、系統(tǒng)及存儲介質(zhì)。方法包括:從復(fù)刻業(yè)務(wù)服務(wù)器獲取用戶訓(xùn)練文本;輸出用戶訓(xùn)練文本;采集目標(biāo)用戶的語音,以獲得用戶錄音文件;在用戶訓(xùn)練文本所包含的文字信息與用戶錄音文件所表達(dá)的文字信息相匹配的情況下,將用戶錄音文件直接或經(jīng)由復(fù)刻業(yè)務(wù)服務(wù)器上傳到模型訓(xùn)練服務(wù)器,以在模型訓(xùn)練服務(wù)器上基于用戶錄音文件訓(xùn)練專屬于目標(biāo)用戶的個性化語音合成模型;從模型訓(xùn)練服務(wù)器直接或經(jīng)由復(fù)刻業(yè)務(wù)服務(wù)器接收個性化語音合成模型的訓(xùn)練結(jié)果信息;基于訓(xùn)練結(jié)果信息輸出關(guān)于個性化語音合成模型的訓(xùn)練是否完成的反饋信息。使得客戶端(或客戶端上的目標(biāo)應(yīng)用)具備支持聲音復(fù)刻的能力。 |
