一種語音合成方法和系統(tǒng)
基本信息
申請?zhí)?/td> | CN202010768946.8 | 申請日 | - |
公開(公告)號 | CN111899716A | 公開(公告)日 | 2020-11-06 |
申請公布號 | CN111899716A | 申請公布日 | 2020-11-06 |
分類號 | G10L13/047(2013.01)I | 分類 | 樂器;聲學(xué); |
發(fā)明人 | 易中華 | 申請(專利權(quán))人 | 北京帝派智能科技有限公司 |
代理機構(gòu) | 北京弘權(quán)知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) | 代理人 | 北京帝派智能科技有限公司 |
地址 | 100089北京市海淀區(qū)萬泉莊路28號萬柳新貴大廈A座6層632室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本申請?zhí)峁┝艘环N語音合成方法和系統(tǒng),以成對設(shè)置的文本發(fā)音單元序列和語音頻譜單元序列作為訓(xùn)練數(shù)據(jù),能夠?qū)⑽谋景l(fā)音單元序列進行編碼,得到對應(yīng)的包含多個元素的編碼序列;以及將編碼序列中的每個元素復(fù)制目標次數(shù),并按照各個元素在編碼序列中的先后順序?qū)λ性剡M行排列,得到擴增編碼序列;以及將擴增編碼序列進行解碼,得到語音頻譜單元預(yù)測序列,語音頻譜單元預(yù)測序列與語音頻譜單元序列的損失距離作為訓(xùn)練語音合成系統(tǒng)的監(jiān)督信號。因此,本申請?zhí)峁┑募夹g(shù)方案,不需要對訓(xùn)練數(shù)據(jù)進行文本發(fā)音單元?音頻特征幀的對齊處理,并且采用了非遞歸的編碼和解碼方式,在顯著簡化訓(xùn)練工作流程的同時,提高了語音合成的準確性和效率。?? |
