一種可在線訓(xùn)練個(gè)性化音色庫(kù)的語(yǔ)音合成方法和系統(tǒng)
基本信息
申請(qǐng)?zhí)?/td> | CN202110271444.9 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN113035169A | 公開(公告)日 | 2021-06-25 |
申請(qǐng)公布號(hào) | CN113035169A | 申請(qǐng)公布日 | 2021-06-25 |
分類號(hào) | G10L13/02;G10L13/04;G10L13/08 | 分類 | 樂器;聲學(xué); |
發(fā)明人 | 牛歌 | 申請(qǐng)(專利權(quán))人 | 北京帝派智能科技有限公司 |
代理機(jī)構(gòu) | 北京弘權(quán)知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | 郭放;許偉群 |
地址 | 100080 北京市海淀區(qū)海淀大街34號(hào)8層820室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本申請(qǐng)實(shí)施例提供了一種可在線訓(xùn)練個(gè)性化音色庫(kù)的語(yǔ)音合成方法及系統(tǒng)。其中,該方法包括:使用至少兩組語(yǔ)料訓(xùn)練預(yù)訓(xùn)練語(yǔ)音合成模型,每一組語(yǔ)料包括文本及其錄制語(yǔ)音,每一組語(yǔ)料的錄制語(yǔ)音具有一種音色,不同組語(yǔ)料中的錄制語(yǔ)音的音色不同;使用目標(biāo)發(fā)音人的語(yǔ)料基于預(yù)訓(xùn)練語(yǔ)音合成模型訓(xùn)練語(yǔ)音合成模型,目標(biāo)發(fā)音人的語(yǔ)料包括目標(biāo)發(fā)音人的至少一句文本及其錄制語(yǔ)音;將語(yǔ)音合成模型部署在語(yǔ)音合成系統(tǒng)中,以使得語(yǔ)音合成系統(tǒng)用于根據(jù)輸入的文本合成目標(biāo)音色的語(yǔ)音,目標(biāo)音色為目標(biāo)發(fā)音人的音色。本申請(qǐng)的技術(shù)方案使用少量的目標(biāo)發(fā)音人的語(yǔ)料,快速且準(zhǔn)確地訓(xùn)練得到一個(gè)語(yǔ)音合成模型,通過(guò)該模型可以準(zhǔn)確地合成出與目標(biāo)發(fā)音人音色一致的語(yǔ)音。 |
