神經網絡聲碼器語音合成的方法、裝置、設備以及介質
基本信息
申請?zhí)?/td> | CN202110545405.3 | 申請日 | - |
公開(公告)號 | CN113345406A | 公開(公告)日 | 2021-09-03 |
申請公布號 | CN113345406A | 申請公布日 | 2021-09-03 |
分類號 | G10L13/02(2013.01)I;G10L19/04(2013.01)I;G10L19/16(2013.01)I;G10L19/26(2013.01)I;G10L25/24(2013.01)I;G10L25/30(2013.01)I | 分類 | 樂器;聲學; |
發(fā)明人 | 王飛;張李;王歡良;唐浩元;王佳珺;代大明 | 申請(專利權)人 | 蘇州奇夢者科技有限公司 |
代理機構 | 蘇州銘浩知識產權代理事務所(普通合伙) | 代理人 | 朱斌兵 |
地址 | 215000江蘇省蘇州市中國(江蘇)自由貿易試驗區(qū)蘇州片區(qū)蘇州工業(yè)園區(qū)若水路388號E1905室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了神經網絡聲碼器語音合成的方法、裝置、設備以及介質,其將音頻低頻由線性預測濾波器建模生成,將高頻細節(jié)部分用自回歸殘差網絡補全,同時將自回歸殘差網絡進行補充完善,然后將低頻細節(jié)和高頻細節(jié)疊加,最后輸出語音,合成的穩(wěn)定性高,其中的多通道以及一步多點技術增加推理運算效率,另外對RNN結構的塊稀疏化、減小自回歸的運算量的同時提升矩陣運算計算效率,從而實現了讓語音合成提供最佳質量的同時保證高效實,具有參數量低、合成速度快和合成音質高特點,符合實際的使用需求。 |
