一種適用于電商直播中虛擬主播的自動語音合成方法

基本信息

申請?zhí)?/td> CN202210285104.6 申請日 -
公開(公告)號 CN114387947A 公開(公告)日 2022-04-22
申請公布號 CN114387947A 申請公布日 2022-04-22
分類號 G10L13/08(2013.01)I;H04N21/2187(2011.01)I;H04N21/233(2011.01)I 分類 樂器;聲學(xué);
發(fā)明人 梁晨陽 申請(專利權(quán))人 北京中科深智科技有限公司
代理機(jī)構(gòu) - 代理人 -
地址 100000北京市大興區(qū)北京經(jīng)濟(jì)技術(shù)開發(fā)區(qū)永昌中路4號院4號樓3層311A室
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種適用于電商直播中虛擬主播的自動語音合成方法,包括:對中文數(shù)據(jù)進(jìn)行處理,以獲取中文音頻,以及中文因素庫;對英文單詞進(jìn)行處理,以獲取英文單詞音頻,并根據(jù)中文因素庫,獲取英文單詞對應(yīng)的中文因素標(biāo)簽;對英文字母進(jìn)行處理,以獲取英文字母發(fā)音音頻,以及字母對應(yīng)的中文因素標(biāo)簽;將中文音頻、中文因素庫、英文單詞音頻、英文單詞對應(yīng)的中文因素標(biāo)簽、字母發(fā)音音頻和字母對應(yīng)的中文因素標(biāo)簽作為混合預(yù)料進(jìn)行模型訓(xùn)練,以獲取語音模型;對待合成的語料進(jìn)行預(yù)處理,以獲取對應(yīng)的中文音素標(biāo)簽,并輸入至語音模型,生成文本對應(yīng)的音頻文件,完成語音合成。本發(fā)明具有較好的中英混合能力,并且語音自然。