一種語音合成方法及裝置

基本信息

申請?zhí)?/td> CN201811008531.X 申請日 -
公開(公告)號 CN109102796A 公開(公告)日 2018-12-28
申請公布號 CN109102796A 申請公布日 2018-12-28
分類號 G10L13/08;G10L13/10;G10L13/02 分類 樂器;聲學(xué);
發(fā)明人 陳長偉;楊曉亮;田丹 申請(專利權(quán))人 北京未來媒體科技股份有限公司
代理機構(gòu) 北京集佳知識產(chǎn)權(quán)代理有限公司 代理人 王寶筠
地址 100142 北京市海淀區(qū)西四環(huán)北路158號1幢6層6032號
法律狀態(tài) -

摘要

摘要 本申請?zhí)岢鲆环N語音合成方法,包括:識別待處理的文本所包含的音素;根據(jù)所述待處理文本所包含的各個音素所在的文本場景,將所述待處理文本分割成文本片段;預(yù)測各個文本片段中的各個音素的發(fā)音持續(xù)時間、發(fā)音頻率、音調(diào)和語調(diào);根據(jù)所述各個文本片段中的各個音素的發(fā)音持續(xù)時間、發(fā)音頻率、音調(diào)和語調(diào),對所述待處理文本所包含的各個音素進行合并處理,得到與所述待處理文本對應(yīng)的語音。上述方法在合成語音時,攜帶音調(diào)、語調(diào)信息,同時在對音素進行合并時,考慮了音素發(fā)音持續(xù)時間和發(fā)音頻率,合成的語音包含了更過的自然語言信息,與真人發(fā)聲更加接近。