神經(jīng)網(wǎng)絡(luò)聲碼器語(yǔ)音合成的方法、裝置、設(shè)備以及介質(zhì)

基本信息

申請(qǐng)?zhí)?/td> CN202110545405.3 申請(qǐng)日 -
公開(公告)號(hào) CN113345406A 公開(公告)日 2021-09-03
申請(qǐng)公布號(hào) CN113345406A 申請(qǐng)公布日 2021-09-03
分類號(hào) G10L13/02(2013.01)I;G10L19/04(2013.01)I;G10L19/16(2013.01)I;G10L19/26(2013.01)I;G10L25/24(2013.01)I;G10L25/30(2013.01)I 分類 樂器;聲學(xué);
發(fā)明人 王飛;張李;王歡良;唐浩元;王佳珺;代大明 申請(qǐng)(專利權(quán))人 蘇州奇夢(mèng)者科技有限公司
代理機(jī)構(gòu) 蘇州銘浩知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 朱斌兵
地址 215000江蘇省蘇州市中國(guó)(江蘇)自由貿(mào)易試驗(yàn)區(qū)蘇州片區(qū)蘇州工業(yè)園區(qū)若水路388號(hào)E1905室
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了神經(jīng)網(wǎng)絡(luò)聲碼器語(yǔ)音合成的方法、裝置、設(shè)備以及介質(zhì),其將音頻低頻由線性預(yù)測(cè)濾波器建模生成,將高頻細(xì)節(jié)部分用自回歸殘差網(wǎng)絡(luò)補(bǔ)全,同時(shí)將自回歸殘差網(wǎng)絡(luò)進(jìn)行補(bǔ)充完善,然后將低頻細(xì)節(jié)和高頻細(xì)節(jié)疊加,最后輸出語(yǔ)音,合成的穩(wěn)定性高,其中的多通道以及一步多點(diǎn)技術(shù)增加推理運(yùn)算效率,另外對(duì)RNN結(jié)構(gòu)的塊稀疏化、減小自回歸的運(yùn)算量的同時(shí)提升矩陣運(yùn)算計(jì)算效率,從而實(shí)現(xiàn)了讓語(yǔ)音合成提供最佳質(zhì)量的同時(shí)保證高效實(shí),具有參數(shù)量低、合成速度快和合成音質(zhì)高特點(diǎn),符合實(shí)際的使用需求。