一種實時變聲的方法、裝置及電子設備

基本信息

申請?zhí)?/td> CN202110463732.4 申請日 -
公開(公告)號 CN113362807A 公開(公告)日 2021-09-07
申請公布號 CN113362807A 申請公布日 2021-09-07
分類號 G10L15/02;G10L15/06;G10L15/22;G10L19/16;G10L21/013 分類 樂器;聲學;
發(fā)明人 戈文碩;劉愷;陳偉 申請(專利權)人 北京搜狗智能科技有限公司
代理機構 北京華沛德權律師事務所 代理人 房德權
地址 100084 北京市海淀區(qū)中關村東路1號院9號樓8層802
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種實時變聲的方法,獲取源說話人的原語音數(shù)據(jù);通過語音識別模型提取原始音頻識別特征;將所述原始音頻識別特征輸入到目標變聲模型中,輸出所述目標說話人的聲學特征;將所述目標說話人的聲學特征以所述目標語音進行輸出。上述技術方案中,由于語音識別模型的參數(shù)量小于第一設定參數(shù)量,且目標變聲模型的參數(shù)量小于第二設定參數(shù)量,使得語音識別模型和目標變聲模型均為小模型,且采用了流式調度特征提取,如此,能夠極大的縮減計算量,從而能夠實現(xiàn)低響應延遲的實時變聲的效果。