少量錄音樣本情況下語音合成方法

基本信息

申請(qǐng)?zhí)?/td> CN201910762228.7 申請(qǐng)日 -
公開(公告)號(hào) CN110544466A 公開(公告)日 2019-12-06
申請(qǐng)公布號(hào) CN110544466A 申請(qǐng)公布日 2019-12-06
分類號(hào) G10L13/02(2013.01) 分類 樂器;聲學(xué);
發(fā)明人 劉嗣平; 陳孟達(dá); 柯登峰 申請(qǐng)(專利權(quán))人 廣州九四智能科技有限公司
代理機(jī)構(gòu) 北京聯(lián)瑞聯(lián)豐知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 廣州九四智能科技有限公司
地址 510000 廣東省廣州市天河區(qū)棠下涌西路35號(hào)806C
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種少量錄音樣本情況下語音合成方法,包括如下步驟:A)運(yùn)用目標(biāo)錄音人員所錄制的少量訓(xùn)練語句得到背景說話人模型;B)通過自適應(yīng)算法將所得到的當(dāng)前說話人語句和原始錄制的完整的說話人語句,分別建立說話人模型;C)通過調(diào)整所述說話人模型的均值和方差,實(shí)現(xiàn)語音的合成,將錄制的少量錄音合成出完整的錄音語句。實(shí)施本發(fā)明的少量錄音樣本情況下語音合成方法,具有以下有益效果:針對(duì)同樣的錄音文本,不必讓多個(gè)客服人員進(jìn)行重復(fù)錄制,降低語音錄制成本,并能保證整個(gè)對(duì)話過程效果的流暢性和自然度。