語音合成方法、系統(tǒng)、語音合成模型及其訓(xùn)練方法
基本信息
申請?zhí)?/td> | CN202111205560.7 | 申請日 | - |
公開(公告)號 | CN113948061A | 公開(公告)日 | 2022-01-18 |
申請公布號 | CN113948061A | 申請公布日 | 2022-01-18 |
分類號 | G10L13/08(2013.01)I;G10L13/10(2013.01)I;G10L25/63(2013.01)I | 分類 | 樂器;聲學(xué); |
發(fā)明人 | 司馬華鵬;毛志強(qiáng) | 申請(專利權(quán))人 | 宿遷硅基智能科技有限公司 |
代理機(jī)構(gòu) | 北京弘權(quán)知識產(chǎn)權(quán)代理有限公司 | 代理人 | 逯長明;許偉群 |
地址 | 223808江蘇省宿遷市湖濱新區(qū)保險小鎮(zhèn)B19棟201室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本申請?zhí)峁┮环N語音合成方法、系統(tǒng)、語音合成模型及其訓(xùn)練方法,所述方法包括獲取目標(biāo)文本和目標(biāo)文本的第一瓶頸特征;獲取參考音頻庫,參考音頻庫包括若干參考音頻;獲取參考音頻庫中每一個參考音頻對應(yīng)的參考文本,以及,獲取每一個參考文本的第二瓶頸特征;計(jì)算第一瓶頸特征與每一個參考文本的第二瓶頸特征的相似度,將與第一瓶頸特征相似度最高的第二瓶頸特征對應(yīng)的參考文本確定為文本模板;將文本模板對應(yīng)的參考音頻確定為音頻模板;將音頻模板和目標(biāo)文本輸入預(yù)先訓(xùn)練的語音合成模型中,以合成具備深度情感層次特征的語音。 |
