一種可在線訓(xùn)練個(gè)性化音色庫(kù)的語(yǔ)音合成方法和系統(tǒng)

基本信息

申請(qǐng)?zhí)?/td> CN202110271444.9 申請(qǐng)日 -
公開(公告)號(hào) CN113035169A 公開(公告)日 2021-06-25
申請(qǐng)公布號(hào) CN113035169A 申請(qǐng)公布日 2021-06-25
分類號(hào) G10L13/02;G10L13/04;G10L13/08 分類 樂器;聲學(xué);
發(fā)明人 牛歌 申請(qǐng)(專利權(quán))人 北京帝派智能科技有限公司
代理機(jī)構(gòu) 北京弘權(quán)知識(shí)產(chǎn)權(quán)代理有限公司 代理人 郭放;許偉群
地址 100080 北京市海淀區(qū)海淀大街34號(hào)8層820室
法律狀態(tài) -

摘要

摘要 本申請(qǐng)實(shí)施例提供了一種可在線訓(xùn)練個(gè)性化音色庫(kù)的語(yǔ)音合成方法及系統(tǒng)。其中,該方法包括:使用至少兩組語(yǔ)料訓(xùn)練預(yù)訓(xùn)練語(yǔ)音合成模型,每一組語(yǔ)料包括文本及其錄制語(yǔ)音,每一組語(yǔ)料的錄制語(yǔ)音具有一種音色,不同組語(yǔ)料中的錄制語(yǔ)音的音色不同;使用目標(biāo)發(fā)音人的語(yǔ)料基于預(yù)訓(xùn)練語(yǔ)音合成模型訓(xùn)練語(yǔ)音合成模型,目標(biāo)發(fā)音人的語(yǔ)料包括目標(biāo)發(fā)音人的至少一句文本及其錄制語(yǔ)音;將語(yǔ)音合成模型部署在語(yǔ)音合成系統(tǒng)中,以使得語(yǔ)音合成系統(tǒng)用于根據(jù)輸入的文本合成目標(biāo)音色的語(yǔ)音,目標(biāo)音色為目標(biāo)發(fā)音人的音色。本申請(qǐng)的技術(shù)方案使用少量的目標(biāo)發(fā)音人的語(yǔ)料,快速且準(zhǔn)確地訓(xùn)練得到一個(gè)語(yǔ)音合成模型,通過(guò)該模型可以準(zhǔn)確地合成出與目標(biāo)發(fā)音人音色一致的語(yǔ)音。