一種語音合成方法及裝置
基本信息
申請?zhí)?/td> | CN201811008531.X | 申請日 | - |
公開(公告)號 | CN109102796A | 公開(公告)日 | 2018-12-28 |
申請公布號 | CN109102796A | 申請公布日 | 2018-12-28 |
分類號 | G10L13/08;G10L13/10;G10L13/02 | 分類 | 樂器;聲學(xué); |
發(fā)明人 | 陳長偉;楊曉亮;田丹 | 申請(專利權(quán))人 | 北京未來媒體科技股份有限公司 |
代理機構(gòu) | 北京集佳知識產(chǎn)權(quán)代理有限公司 | 代理人 | 王寶筠 |
地址 | 100142 北京市海淀區(qū)西四環(huán)北路158號1幢6層6032號 | ||
法律狀態(tài) | - |
摘要
摘要 | 本申請?zhí)岢鲆环N語音合成方法,包括:識別待處理的文本所包含的音素;根據(jù)所述待處理文本所包含的各個音素所在的文本場景,將所述待處理文本分割成文本片段;預(yù)測各個文本片段中的各個音素的發(fā)音持續(xù)時間、發(fā)音頻率、音調(diào)和語調(diào);根據(jù)所述各個文本片段中的各個音素的發(fā)音持續(xù)時間、發(fā)音頻率、音調(diào)和語調(diào),對所述待處理文本所包含的各個音素進行合并處理,得到與所述待處理文本對應(yīng)的語音。上述方法在合成語音時,攜帶音調(diào)、語調(diào)信息,同時在對音素進行合并時,考慮了音素發(fā)音持續(xù)時間和發(fā)音頻率,合成的語音包含了更過的自然語言信息,與真人發(fā)聲更加接近。 |
