一種語音合成模型的評價方法、裝置、設備及存儲介質

基本信息

申請?zhí)?/td> CN202011148521.3 申請日 -
公開(公告)號 CN112466272A 公開(公告)日 2021-03-09
申請公布號 CN112466272A 申請公布日 2021-03-09
分類號 G10L13/02(2013.01)I;G10L13/04(2013.01)I 分類 樂器;聲學;
發(fā)明人 陸健;徐欣康;胡新輝 申請(專利權)人 浙江同花順智能科技有限公司
代理機構 北京品源專利代理有限公司 代理人 孟金喆
地址 310023浙江省杭州市余杭區(qū)五常街道同順街18號3樓305室
法律狀態(tài) -

摘要

摘要 本發(fā)明實施例公開了一種語音合成模型的評價方法、裝置、設備及存儲介質。其中,該方法包括:當輸入文本通過預設模型合成語音輸出時,生成第一權重矩陣,所述預設模型為基于注意力機制的端到端語音合成模型,所述第一權重矩陣中的元素表示所述語音的語音幀對齊所述輸入文本的字符的概率;確定第一權重矩陣中每個權重的重要程度指數,并根據所述每個權重的重要程度指數形成第二權重矩陣;通過第一權重矩陣和第二權重矩陣確定所述預設模型的得分,所述得分用于表征預設模型的效果。本發(fā)明實施例提供的技術方案,不需要額外的語音識別模塊,提高了語音合成模型評價結果的準確性,有利于提高預設模型的訓練效率。??