一種可控制韻律情感的語(yǔ)音合成方法、裝置、存儲(chǔ)介質(zhì)

基本信息

申請(qǐng)?zhí)?/td> CN201910706204.X 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN110299131B 公開(kāi)(公告)日 2021-12-10
申請(qǐng)公布號(hào) CN110299131B 申請(qǐng)公布日 2021-12-10
分類號(hào) G10L13/10 分類 樂(lè)器;聲學(xué);
發(fā)明人 王歡良;王飛;張李;沈文武;代大明 申請(qǐng)(專利權(quán))人 蘇州奇夢(mèng)者科技有限公司
代理機(jī)構(gòu) 蘇州國(guó)誠(chéng)專利代理有限公司 代理人 陳松
地址 215024 江蘇省蘇州市工業(yè)園區(qū)若水路388號(hào)納米技術(shù)國(guó)家大學(xué)科技園E棟1604
法律狀態(tài) -

摘要

摘要 本發(fā)明提供了一種可控制韻律情感的語(yǔ)音合成方法、裝置、存儲(chǔ)介質(zhì),其可以在合成語(yǔ)音中添加韻律情感,有效控制合成語(yǔ)音的韻律節(jié)奏,方法包括以下步驟:將待合成文本對(duì)應(yīng)的字符轉(zhuǎn)化為字符表示向量;將字符表示向量與和韻律節(jié)奏向量進(jìn)行拼接,然后輸入編碼器,輸出編碼特征向量;將編碼特征向量與韻律節(jié)奏向量拼接,通過(guò)注意力機(jī)制,生成注意力向量;將前一時(shí)刻的預(yù)測(cè)出的頻譜幀與注意力向量做拼接,送入解碼器,通過(guò)解碼器的輸出更新注意力向量,新計(jì)算出來(lái)的注意力向量與解碼器輸出做拼接,送入投影層輸出帶有韻律節(jié)奏的預(yù)測(cè)語(yǔ)音頻譜,同時(shí)預(yù)測(cè)頻譜生成的結(jié)束點(diǎn);將帶有韻律節(jié)奏的預(yù)測(cè)語(yǔ)音頻譜轉(zhuǎn)化成帶有韻律節(jié)奏的語(yǔ)音輸出。