一種可控制韻律情感的語音合成方法、裝置、存儲(chǔ)介質(zhì)
基本信息
申請(qǐng)?zhí)?/td> | CN201910706204.X | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN110299131A | 公開(公告)日 | 2019-10-01 |
申請(qǐng)公布號(hào) | CN110299131A | 申請(qǐng)公布日 | 2019-10-01 |
分類號(hào) | G10L13/10 | 分類 | 樂器;聲學(xué); |
發(fā)明人 | 王歡良;王飛;張李;沈文武;代大明 | 申請(qǐng)(專利權(quán))人 | 蘇州奇夢(mèng)者科技有限公司 |
代理機(jī)構(gòu) | 蘇州國(guó)誠(chéng)專利代理有限公司 | 代理人 | 蘇州奇夢(mèng)者網(wǎng)絡(luò)科技有限公司 |
地址 | 215024 江蘇省蘇州市工業(yè)園區(qū)若水路388號(hào)納米技術(shù)國(guó)家大學(xué)科技園E棟1604 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明提供了一種可控制韻律情感的語音合成方法、裝置、存儲(chǔ)介質(zhì),其可以在合成語音中添加韻律情感,有效控制合成語音的韻律節(jié)奏,方法包括以下步驟:將待合成文本對(duì)應(yīng)的字符轉(zhuǎn)化為字符表示向量;將字符表示向量與和韻律節(jié)奏向量進(jìn)行拼接,然后輸入編碼器,輸出編碼特征向量;將編碼特征向量與韻律節(jié)奏向量拼接,通過注意力機(jī)制,生成注意力向量;將前一時(shí)刻的預(yù)測(cè)出的頻譜幀與注意力向量做拼接,送入解碼器,通過解碼器的輸出更新注意力向量,新計(jì)算出來的注意力向量與解碼器輸出做拼接,送入投影層輸出帶有韻律節(jié)奏的預(yù)測(cè)語音頻譜,同時(shí)預(yù)測(cè)頻譜生成的結(jié)束點(diǎn);將帶有韻律節(jié)奏的預(yù)測(cè)語音頻譜轉(zhuǎn)化成帶有韻律節(jié)奏的語音輸出。 |
