自適應(yīng)語音合成方法、裝置、可讀存儲(chǔ)介質(zhì)及計(jì)算設(shè)備

基本信息

申請(qǐng)?zhí)?/td> CN201910661648.6 申請(qǐng)日 -
公開(公告)號(hào) CN110379407B 公開(公告)日 2021-10-19
申請(qǐng)公布號(hào) CN110379407B 申請(qǐng)公布日 2021-10-19
分類號(hào) G10L13/02(2013.01)I;G10L13/08(2013.01)I;G10L25/30(2013.01)I 分類 樂器;聲學(xué);
發(fā)明人 殷昊 申請(qǐng)(專利權(quán))人 出門問問(蘇州)信息科技有限公司
代理機(jī)構(gòu) 北京鼎承知識(shí)產(chǎn)權(quán)代理有限公司 代理人 田恩濤;柯宏達(dá)
地址 215123江蘇省蘇州市工業(yè)園區(qū)星湖街328號(hào)創(chuàng)意產(chǎn)業(yè)園4-B404單元
法律狀態(tài) -

摘要

摘要 本公開實(shí)施例提供了一種自適應(yīng)語音合成方法、裝置、可讀存儲(chǔ)介質(zhì)及計(jì)算設(shè)備,用于在僅有少量的且發(fā)音質(zhì)量不高的語音數(shù)據(jù)的條件下,合成效果不錯(cuò)的說話人語音。方法包括:獲取基礎(chǔ)語音數(shù)據(jù)和基礎(chǔ)語音數(shù)據(jù)對(duì)應(yīng)的文本數(shù)據(jù);根據(jù)基礎(chǔ)語音數(shù)據(jù)和基礎(chǔ)語音數(shù)據(jù)對(duì)應(yīng)的文本數(shù)據(jù),訓(xùn)練基礎(chǔ)語音模型;獲取說話人的語音數(shù)據(jù)和說話人的語音數(shù)據(jù)對(duì)應(yīng)的文本數(shù)據(jù);根據(jù)說話人的語音數(shù)據(jù)和說話人的語音數(shù)據(jù)對(duì)應(yīng)的文本數(shù)據(jù),以及基礎(chǔ)語音模型,訓(xùn)練GRU語音模型;當(dāng)接收到語音合成指令時(shí),根據(jù)GRU語音模型和指令包含的文字信息,合成說話人的語音。