一種實(shí)時變聲的方法、裝置及電子設(shè)備

基本信息

申請?zhí)?/td> CN202110463732.4 申請日 -
公開(公告)號 CN113362807A 公開(公告)日 2021-09-07
申請公布號 CN113362807A 申請公布日 2021-09-07
分類號 G10L15/02;G10L15/06;G10L15/22;G10L19/16;G10L21/013 分類 樂器;聲學(xué);
發(fā)明人 戈文碩;劉愷;陳偉 申請(專利權(quán))人 北京搜狗智能科技有限公司
代理機(jī)構(gòu) 北京華沛德權(quán)律師事務(wù)所 代理人 房德權(quán)
地址 100084 北京市海淀區(qū)中關(guān)村東路1號院9號樓8層802
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種實(shí)時變聲的方法,獲取源說話人的原語音數(shù)據(jù);通過語音識別模型提取原始音頻識別特征;將所述原始音頻識別特征輸入到目標(biāo)變聲模型中,輸出所述目標(biāo)說話人的聲學(xué)特征;將所述目標(biāo)說話人的聲學(xué)特征以所述目標(biāo)語音進(jìn)行輸出。上述技術(shù)方案中,由于語音識別模型的參數(shù)量小于第一設(shè)定參數(shù)量,且目標(biāo)變聲模型的參數(shù)量小于第二設(shè)定參數(shù)量,使得語音識別模型和目標(biāo)變聲模型均為小模型,且采用了流式調(diào)度特征提取,如此,能夠極大的縮減計(jì)算量,從而能夠?qū)崿F(xiàn)低響應(yīng)延遲的實(shí)時變聲的效果。