一種語(yǔ)音轉(zhuǎn)換方法、裝置、電子設(shè)備和存儲(chǔ)介質(zhì)

基本信息

申請(qǐng)?zhí)?/td> CN202110693848.7 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN113421571A 公開(kāi)(公告)日 2021-09-21
申請(qǐng)公布號(hào) CN113421571A 申請(qǐng)公布日 2021-09-21
分類(lèi)號(hào) G10L15/26(2006.01)I;G10L13/08(2013.01)I;G10L13/04(2013.01)I;G10L13/02(2013.01)I 分類(lèi) 樂(lè)器;聲學(xué);
發(fā)明人 賀來(lái)朋;孫見(jiàn)青;梁家恩 申請(qǐng)(專(zhuān)利權(quán))人 云知聲智能科技股份有限公司
代理機(jī)構(gòu) - 代理人 -
地址 100096北京市海淀區(qū)西三旗建材城內(nèi)1幢一層101號(hào)
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及一種語(yǔ)音轉(zhuǎn)換方法、裝置、電子設(shè)備和存儲(chǔ)介質(zhì),該方法應(yīng)用于將源發(fā)音人的語(yǔ)音轉(zhuǎn)換為目標(biāo)發(fā)音人的語(yǔ)音,包括:獲取源發(fā)音人的語(yǔ)音,根據(jù)源發(fā)音人的語(yǔ)音確定源發(fā)音人的文本;將源發(fā)音人的文本輸入至目標(biāo)發(fā)音人的語(yǔ)音合成模型和時(shí)長(zhǎng)強(qiáng)制對(duì)齊模型中合成目標(biāo)發(fā)音人的語(yǔ)音;其中,譜特征預(yù)測(cè)模塊中包括時(shí)長(zhǎng)模型以及聲學(xué)特征模塊。本申請(qǐng)通過(guò)時(shí)長(zhǎng)強(qiáng)制對(duì)齊模型對(duì)源發(fā)音人的語(yǔ)音做強(qiáng)制對(duì)齊,得到源發(fā)音人的強(qiáng)制對(duì)齊時(shí)長(zhǎng)信息,使用強(qiáng)制對(duì)齊的時(shí)長(zhǎng)信息對(duì)時(shí)長(zhǎng)模型預(yù)測(cè)的時(shí)長(zhǎng)做調(diào)整,得到調(diào)整后的時(shí)長(zhǎng)信息,并根據(jù)調(diào)整后的時(shí)長(zhǎng)信息合成目標(biāo)發(fā)音人的語(yǔ)音,使得轉(zhuǎn)換后語(yǔ)音的語(yǔ)速與輸入語(yǔ)音保持一致,從而使得轉(zhuǎn)換后語(yǔ)音的發(fā)音風(fēng)格與源發(fā)音人保持一致。