一種基于Bottleneck特征訓(xùn)練克隆音色及韻律的系統(tǒng)及方法
基本信息
申請(qǐng)?zhí)?/td> | CN202010314822.2 | 申請(qǐng)日 | - |
公開(kāi)(公告)號(hào) | CN111210803B | 公開(kāi)(公告)日 | 2021-08-03 |
申請(qǐng)公布號(hào) | CN111210803B | 申請(qǐng)公布日 | 2021-08-03 |
分類號(hào) | G10L13/02(2013.01)I;G10L15/02(2006.01)I;G10L15/06(2013.01)I;G10L15/16(2006.01)I;G10L25/03(2013.01)I;G10L25/24(2013.01)I;G10L25/30(2013.01)I;G10L25/12(2013.01)I | 分類 | 樂(lè)器;聲學(xué); |
發(fā)明人 | 司馬華鵬;龔雪飛 | 申請(qǐng)(專利權(quán))人 | 南京硅基智能科技有限公司 |
代理機(jī)構(gòu) | 江蘇舜點(diǎn)律師事務(wù)所 | 代理人 | 杜東輝 |
地址 | 210012江蘇省南京市雨花臺(tái)區(qū)軟件大道66號(hào)-1 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明涉及語(yǔ)音合成、語(yǔ)音識(shí)別、聲音克隆技術(shù)領(lǐng)域,本發(fā)明結(jié)合語(yǔ)音合成技術(shù)、語(yǔ)音識(shí)別技術(shù)、遷移學(xué)習(xí)技術(shù),提供一種基于Bottleneck特征(音頻的語(yǔ)言特征)的聲音克隆實(shí)現(xiàn)方案,包含訓(xùn)練系統(tǒng)和訓(xùn)練方法;利用少量樣本提供自然度、相似度高的TTS服務(wù),以提供目標(biāo)用戶特性的TTS服務(wù),解決了語(yǔ)音合成技術(shù)服務(wù)樣本量大、制作周期長(zhǎng)、人力成本高的問(wèn)題。訓(xùn)練系統(tǒng)包括:數(shù)據(jù)采集模塊、聲學(xué)特征提取模塊、語(yǔ)音識(shí)別模塊、韻律模塊、多人語(yǔ)音聲學(xué)模塊、語(yǔ)音合成模塊;本發(fā)明還提供一種基于上述系統(tǒng)訓(xùn)練方法,包括準(zhǔn)備訓(xùn)練語(yǔ)料、聲學(xué)特征提取、各模塊訓(xùn)練和微調(diào),以及語(yǔ)音合成。 |
