一種語音合成方法和系統(tǒng)

基本信息

申請?zhí)?/td> CN202010768946.8 申請日 -
公開(公告)號 CN111899716A 公開(公告)日 2020-11-06
申請公布號 CN111899716A 申請公布日 2020-11-06
分類號 G10L13/047(2013.01)I 分類 樂器;聲學(xué);
發(fā)明人 易中華 申請(專利權(quán))人 北京帝派智能科技有限公司
代理機構(gòu) 北京弘權(quán)知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 北京帝派智能科技有限公司
地址 100089北京市海淀區(qū)萬泉莊路28號萬柳新貴大廈A座6層632室
法律狀態(tài) -

摘要

摘要 本申請?zhí)峁┝艘环N語音合成方法和系統(tǒng),以成對設(shè)置的文本發(fā)音單元序列和語音頻譜單元序列作為訓(xùn)練數(shù)據(jù),能夠?qū)⑽谋景l(fā)音單元序列進行編碼,得到對應(yīng)的包含多個元素的編碼序列;以及將編碼序列中的每個元素復(fù)制目標次數(shù),并按照各個元素在編碼序列中的先后順序?qū)λ性剡M行排列,得到擴增編碼序列;以及將擴增編碼序列進行解碼,得到語音頻譜單元預(yù)測序列,語音頻譜單元預(yù)測序列與語音頻譜單元序列的損失距離作為訓(xùn)練語音合成系統(tǒng)的監(jiān)督信號。因此,本申請?zhí)峁┑募夹g(shù)方案,不需要對訓(xùn)練數(shù)據(jù)進行文本發(fā)音單元?音頻特征幀的對齊處理,并且采用了非遞歸的編碼和解碼方式,在顯著簡化訓(xùn)練工作流程的同時,提高了語音合成的準確性和效率。??