基于小樣本的語音實時克隆的方法、裝置、設(shè)備和介質(zhì)
基本信息
申請?zhí)?/td> | CN202010397517.4 | 申請日 | - |
公開(公告)號 | CN111681635A | 公開(公告)日 | 2020-09-18 |
申請公布號 | CN111681635A | 申請公布日 | 2020-09-18 |
分類號 | G10L13/02(2013.01)I | 分類 | 樂器;聲學(xué); |
發(fā)明人 | 黃立;陳欽梁;劉琨 | 申請(專利權(quán))人 | 深圳市鏡象科技有限公司 |
代理機構(gòu) | 深圳中細(xì)軟知識產(chǎn)權(quán)代理有限公司 | 代理人 | 深圳市鏡象科技有限公司 |
地址 | 518000廣東省深圳市南山區(qū)中科納能研發(fā)中心C座 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明實施例公開了一種基于小樣本的語音實時克隆的方法,該方法包括:獲取待克隆語音,將待克隆語音輸入說話人特征提取器進行特征提取,得到目標(biāo)說話人特征;獲取待克隆文字文本,將待克隆文字文本輸入拼音轉(zhuǎn)換器進行拼音轉(zhuǎn)換,得到待克隆拼音文本;將目標(biāo)說話人特征與待克隆拼音文本輸入合成器進行克隆合成,將合成器的輸出輸入聲音解碼器進行解碼,得到目標(biāo)克隆語音。由于待克隆拼音文本中每一拼音都對應(yīng)唯一確定的發(fā)音,因此本發(fā)明能提高克隆語音的準(zhǔn)確率,也就提高了克隆語音的克隆質(zhì)量。此外,還提出了基于小樣本的語音實時克隆的裝置、計算機設(shè)備和存儲介質(zhì)。?? |
