一種數(shù)據(jù)標(biāo)注方法、裝置、設(shè)備及可讀存儲介質(zhì)

基本信息

申請?zhí)?/td> CN202110741584.8 申請日 -
公開(公告)號 CN113421543A 公開(公告)日 2021-09-21
申請公布號 CN113421543A 申請公布日 2021-09-21
分類號 G10L13/02(2013.01)I;G10L13/08(2013.01)I 分類 樂器;聲學(xué);
發(fā)明人 陳百靈;劉云峰;汶林丁 申請(專利權(quán))人 深圳追一科技有限公司
代理機構(gòu) 北京集佳知識產(chǎn)權(quán)代理有限公司 代理人 王云曉
地址 518000廣東省深圳市南山區(qū)粵海街道科技園社區(qū)科苑路8號訊美科技廣場3號樓23A、23B
法律狀態(tài) -

摘要

摘要 本申請公開了一種數(shù)據(jù)標(biāo)注方法、裝置、設(shè)備及可讀存儲介質(zhì)。本申請在獲取到相互對應(yīng)的音頻數(shù)據(jù)和文本數(shù)據(jù)后,將音頻數(shù)據(jù)用音頻波形圖和基頻線圖表示,然后識別音頻數(shù)據(jù)中的靜音片段和音高重置片段;最后將靜音片段在文本數(shù)據(jù)中對應(yīng)的文本標(biāo)注為語調(diào)短語,將音高重置片段在文本數(shù)據(jù)中對應(yīng)的文本標(biāo)注為韻律短語,從而標(biāo)注出了文本中的自然語感和韻律,據(jù)此訓(xùn)練TTS模型,可以使TTS模型學(xué)習(xí)人說話時的自然語感和韻律,避免TTS模型輸出的語音機械感較重。相應(yīng)地,本申請?zhí)峁┑囊环N數(shù)據(jù)標(biāo)注裝置、設(shè)備及可讀存儲介質(zhì),也同樣具有上述技術(shù)效果。