高保真的智能客服語音合成方法

基本信息

申請?zhí)?/td> CN201811584612.4 申請日 -
公開(公告)號 CN109686358A 公開(公告)日 2019-04-26
申請公布號 CN109686358A 申請公布日 2019-04-26
分類號 G10L13/02(2013.01)I; G10L13/08(2013.01)I; G10L13/10(2013.01)I 分類 樂器;聲學(xué);
發(fā)明人 劉嗣平; 柯登峰; 陳孟達(dá); 賈宇康 申請(專利權(quán))人 廣州九四智能科技有限公司
代理機(jī)構(gòu) 北京聯(lián)瑞聯(lián)豐知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 廣州九四智能科技有限公司
地址 510000 廣東省廣州市天河區(qū)棠下二社涌邊路69號1007B房
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種高保真的智能客服語音合成方法,包括:進(jìn)行語音的錄制;建立初始語料庫;對錄制好的語音進(jìn)行強制對齊;進(jìn)行語音切割得到三音子模型;利用三音子模型形成目標(biāo)語料庫;對于切割好的三音子基元計算似然;建立三音子決策樹;根據(jù)所需合成文本選擇合適的三音子基元;對選擇的三音子基元,針對原始語音波形做基音同步標(biāo)注;對原始語音波形的基音曲線與目標(biāo)基音曲線建立映射,得到短時合成信號序列;將短時信號序列與目標(biāo)基音周期同步排列,重疊相加得到拼接合成的語音;將合成的語音插入到提前錄制好的語音中。本發(fā)明不必讓客服人員錄制大量重復(fù)類似的含有變量的語音,能夠降低語音錄制成本,還能提升整個對話過程的流暢性與自然度。