一種實(shí)時變聲的方法、裝置及電子設(shè)備
基本信息
申請?zhí)?/td> | CN202110463732.4 | 申請日 | - |
公開(公告)號 | CN113362807A | 公開(公告)日 | 2021-09-07 |
申請公布號 | CN113362807A | 申請公布日 | 2021-09-07 |
分類號 | G10L15/02;G10L15/06;G10L15/22;G10L19/16;G10L21/013 | 分類 | 樂器;聲學(xué); |
發(fā)明人 | 戈文碩;劉愷;陳偉 | 申請(專利權(quán))人 | 北京搜狗智能科技有限公司 |
代理機(jī)構(gòu) | 北京華沛德權(quán)律師事務(wù)所 | 代理人 | 房德權(quán) |
地址 | 100084 北京市海淀區(qū)中關(guān)村東路1號院9號樓8層802 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種實(shí)時變聲的方法,獲取源說話人的原語音數(shù)據(jù);通過語音識別模型提取原始音頻識別特征;將所述原始音頻識別特征輸入到目標(biāo)變聲模型中,輸出所述目標(biāo)說話人的聲學(xué)特征;將所述目標(biāo)說話人的聲學(xué)特征以所述目標(biāo)語音進(jìn)行輸出。上述技術(shù)方案中,由于語音識別模型的參數(shù)量小于第一設(shè)定參數(shù)量,且目標(biāo)變聲模型的參數(shù)量小于第二設(shè)定參數(shù)量,使得語音識別模型和目標(biāo)變聲模型均為小模型,且采用了流式調(diào)度特征提取,如此,能夠極大的縮減計(jì)算量,從而能夠?qū)崿F(xiàn)低響應(yīng)延遲的實(shí)時變聲的效果。 |
