一種語(yǔ)音合成方法和系統(tǒng)
基本信息

| 申請(qǐng)?zhí)?/td> | CN202010768946.8 | 申請(qǐng)日 | - |
| 公開(kāi)(公告)號(hào) | CN111899716B | 公開(kāi)(公告)日 | 2021-03-12 |
| 申請(qǐng)公布號(hào) | CN111899716B | 申請(qǐng)公布日 | 2021-03-12 |
| 分類(lèi)號(hào) | G10L13/047(2013.01)I;G10L13/08(2013.01)I;G10L19/16(2013.01)I;G10L25/30(2013.01)I;G10L19/04(2013.01)I | 分類(lèi) | 樂(lè)器;聲學(xué); |
| 發(fā)明人 | 易中華 | 申請(qǐng)(專(zhuān)利權(quán))人 | 北京帝派智能科技有限公司 |
| 代理機(jī)構(gòu) | 北京弘權(quán)知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) | 代理人 | 郭放;許偉群 |
| 地址 | 100080北京市海淀區(qū)海淀大街34號(hào)8層820室 | ||
| 法律狀態(tài) | - | ||
摘要

| 摘要 | 本申請(qǐng)?zhí)峁┝艘环N語(yǔ)音合成方法和系統(tǒng),以成對(duì)設(shè)置的文本發(fā)音單元序列和語(yǔ)音頻譜單元序列作為訓(xùn)練數(shù)據(jù),能夠?qū)⑽谋景l(fā)音單元序列進(jìn)行編碼,得到對(duì)應(yīng)的包含多個(gè)元素的編碼序列;以及將編碼序列中的每個(gè)元素復(fù)制目標(biāo)次數(shù),并按照各個(gè)元素在編碼序列中的先后順序?qū)λ性剡M(jìn)行排列,得到擴(kuò)增編碼序列;以及將擴(kuò)增編碼序列進(jìn)行解碼,得到語(yǔ)音頻譜單元預(yù)測(cè)序列,語(yǔ)音頻譜單元預(yù)測(cè)序列與語(yǔ)音頻譜單元序列的損失距離作為訓(xùn)練語(yǔ)音合成系統(tǒng)的監(jiān)督信號(hào)。因此,本申請(qǐng)?zhí)峁┑募夹g(shù)方案,不需要對(duì)訓(xùn)練數(shù)據(jù)進(jìn)行文本發(fā)音單元?音頻特征幀的對(duì)齊處理,并且采用了非遞歸的編碼和解碼方式,在顯著簡(jiǎn)化訓(xùn)練工作流程的同時(shí),提高了語(yǔ)音合成的準(zhǔn)確性和效率。?? |





