語(yǔ)音轉(zhuǎn)換與模型訓(xùn)練方法、裝置和系統(tǒng)及存儲(chǔ)介質(zhì)
基本信息
申請(qǐng)?zhí)?/td> | CN202011054910.X | 申請(qǐng)日 | - |
公開(kāi)(公告)號(hào) | CN112185342A | 公開(kāi)(公告)日 | 2021-01-05 |
申請(qǐng)公布號(hào) | CN112185342A | 申請(qǐng)公布日 | 2021-01-05 |
分類號(hào) | G10L13/033;G10L13/08;G10L15/06;G10L15/07;G10L21/003;G10L25/03;G10L25/24;G10L25/30;G06N3/04;G06N3/08 | 分類 | 樂(lè)器;聲學(xué); |
發(fā)明人 | 武劍桃;李秀林 | 申請(qǐng)(專利權(quán))人 | 標(biāo)貝(北京)科技有限公司 |
代理機(jī)構(gòu) | 北京睿邦知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) | 代理人 | 標(biāo)貝(北京)科技有限公司 |
地址 | 100192 北京市海淀區(qū)西小口路66號(hào)中關(guān)村東升科技園·北領(lǐng)地B-2號(hào)樓2層A203A(東升地區(qū)) | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明提供一種語(yǔ)音轉(zhuǎn)換方法、裝置和系統(tǒng)及存儲(chǔ)介質(zhì)與一種模型訓(xùn)練方法、裝置和系統(tǒng)及存儲(chǔ)介質(zhì)。語(yǔ)音轉(zhuǎn)換方法包括:獲取源說(shuō)話者分別在N個(gè)不同通道下的N組源語(yǔ)音數(shù)據(jù),其中,N為大于1的整數(shù);分別對(duì)N組源語(yǔ)音數(shù)據(jù)中的每組源語(yǔ)音數(shù)據(jù)進(jìn)行特征提取,以獲得N組源識(shí)別聲學(xué)特征;對(duì)N組源識(shí)別聲學(xué)特征進(jìn)行特征合并,以獲得源說(shuō)話者的聲學(xué)特征;通過(guò)預(yù)定映射模型將源說(shuō)話者的聲學(xué)特征映射為目標(biāo)說(shuō)話者的聲學(xué)特征;基于目標(biāo)說(shuō)話者的聲學(xué)特征進(jìn)行語(yǔ)音合成,以獲得目標(biāo)說(shuō)話者的目標(biāo)語(yǔ)音?;诙嗤ǖ勒Z(yǔ)音數(shù)據(jù)進(jìn)行模型訓(xùn)練和語(yǔ)音轉(zhuǎn)換,對(duì)嘈雜環(huán)境的魯棒性更高,可以減少語(yǔ)音轉(zhuǎn)換時(shí)識(shí)別不準(zhǔn)的現(xiàn)象。 |
