一種語(yǔ)音合成方法和系統(tǒng)

基本信息

申請(qǐng)?zhí)?/td> CN202010768946.8 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN111899716B 公開(kāi)(公告)日 2021-03-12
申請(qǐng)公布號(hào) CN111899716B 申請(qǐng)公布日 2021-03-12
分類(lèi)號(hào) G10L13/047(2013.01)I;G10L13/08(2013.01)I;G10L19/16(2013.01)I;G10L25/30(2013.01)I;G10L19/04(2013.01)I 分類(lèi) 樂(lè)器;聲學(xué);
發(fā)明人 易中華 申請(qǐng)(專(zhuān)利權(quán))人 北京帝派智能科技有限公司
代理機(jī)構(gòu) 北京弘權(quán)知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 郭放;許偉群
地址 100080北京市海淀區(qū)海淀大街34號(hào)8層820室
法律狀態(tài) -

摘要

摘要 本申請(qǐng)?zhí)峁┝艘环N語(yǔ)音合成方法和系統(tǒng),以成對(duì)設(shè)置的文本發(fā)音單元序列和語(yǔ)音頻譜單元序列作為訓(xùn)練數(shù)據(jù),能夠?qū)⑽谋景l(fā)音單元序列進(jìn)行編碼,得到對(duì)應(yīng)的包含多個(gè)元素的編碼序列;以及將編碼序列中的每個(gè)元素復(fù)制目標(biāo)次數(shù),并按照各個(gè)元素在編碼序列中的先后順序?qū)λ性剡M(jìn)行排列,得到擴(kuò)增編碼序列;以及將擴(kuò)增編碼序列進(jìn)行解碼,得到語(yǔ)音頻譜單元預(yù)測(cè)序列,語(yǔ)音頻譜單元預(yù)測(cè)序列與語(yǔ)音頻譜單元序列的損失距離作為訓(xùn)練語(yǔ)音合成系統(tǒng)的監(jiān)督信號(hào)。因此,本申請(qǐng)?zhí)峁┑募夹g(shù)方案,不需要對(duì)訓(xùn)練數(shù)據(jù)進(jìn)行文本發(fā)音單元?音頻特征幀的對(duì)齊處理,并且采用了非遞歸的編碼和解碼方式,在顯著簡(jiǎn)化訓(xùn)練工作流程的同時(shí),提高了語(yǔ)音合成的準(zhǔn)確性和效率。??