神經網絡聲碼器語音合成的方法、裝置、設備以及介質

基本信息

申請?zhí)?/td> CN202110545405.3 申請日 -
公開(公告)號 CN113345406A 公開(公告)日 2021-09-03
申請公布號 CN113345406A 申請公布日 2021-09-03
分類號 G10L13/02(2013.01)I;G10L19/04(2013.01)I;G10L19/16(2013.01)I;G10L19/26(2013.01)I;G10L25/24(2013.01)I;G10L25/30(2013.01)I 分類 樂器;聲學;
發(fā)明人 王飛;張李;王歡良;唐浩元;王佳珺;代大明 申請(專利權)人 蘇州奇夢者科技有限公司
代理機構 蘇州銘浩知識產權代理事務所(普通合伙) 代理人 朱斌兵
地址 215000江蘇省蘇州市中國(江蘇)自由貿易試驗區(qū)蘇州片區(qū)蘇州工業(yè)園區(qū)若水路388號E1905室
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了神經網絡聲碼器語音合成的方法、裝置、設備以及介質,其將音頻低頻由線性預測濾波器建模生成,將高頻細節(jié)部分用自回歸殘差網絡補全,同時將自回歸殘差網絡進行補充完善,然后將低頻細節(jié)和高頻細節(jié)疊加,最后輸出語音,合成的穩(wěn)定性高,其中的多通道以及一步多點技術增加推理運算效率,另外對RNN結構的塊稀疏化、減小自回歸的運算量的同時提升矩陣運算計算效率,從而實現了讓語音合成提供最佳質量的同時保證高效實,具有參數量低、合成速度快和合成音質高特點,符合實際的使用需求。