端到端的智能語(yǔ)音朗讀評(píng)測(cè)方法
基本信息
申請(qǐng)?zhí)?/td> | CN202010627043.8 | 申請(qǐng)日 | - |
公開(kāi)(公告)號(hào) | CN111883176B | 公開(kāi)(公告)日 | 2022-06-21 |
申請(qǐng)公布號(hào) | CN111883176B | 申請(qǐng)公布日 | 2022-06-21 |
分類(lèi)號(hào) | G10L25/51;G10L15/26;G10L15/02;G10L15/16;G10L15/06;G06N3/04;G06N3/08 | 分類(lèi) | 樂(lè)器;聲學(xué); |
發(fā)明人 | 張展;王曰海 | 申請(qǐng)(專(zhuān)利權(quán))人 | 紹興市科技創(chuàng)業(yè)投資有限公司 |
代理機(jī)構(gòu) | 杭州君度專(zhuān)利代理事務(wù)所(特殊普通合伙) | 代理人 | 徐鋒 |
地址 | 312000 浙江省紹興市越城區(qū)皋埠鎮(zhèn)銀橋路326號(hào) | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開(kāi)了端到端的智能語(yǔ)音朗讀評(píng)測(cè)方法,包括:收集用于訓(xùn)練評(píng)測(cè)神經(jīng)網(wǎng)絡(luò)的朗讀語(yǔ)音、目標(biāo)發(fā)音、錯(cuò)誤代碼、說(shuō)話人信息的數(shù)據(jù)處理流程;針對(duì)說(shuō)話人特征,對(duì)評(píng)測(cè)神經(jīng)網(wǎng)絡(luò)進(jìn)行輔助訓(xùn)練;根據(jù)待評(píng)測(cè)的目標(biāo)發(fā)音與待評(píng)測(cè)發(fā)音,直接由神經(jīng)網(wǎng)絡(luò)端到端輸出評(píng)測(cè)結(jié)果,從輸入目標(biāo)發(fā)音與待評(píng)測(cè)發(fā)音,到輸出評(píng)測(cè)結(jié)果,整個(gè)流程可微分,可直接針對(duì)評(píng)測(cè)指標(biāo)進(jìn)行優(yōu)化。本發(fā)明直接構(gòu)建輸入為語(yǔ)音和待評(píng)測(cè)文本、輸出為反饋結(jié)果的端到端評(píng)測(cè)模式,可與方法中的各個(gè)模塊聯(lián)合訓(xùn)練使得整體效果更好,另外該方法構(gòu)建的輔助任務(wù)能夠更準(zhǔn)確的提取評(píng)測(cè)相關(guān)特征,使得反饋的評(píng)測(cè)結(jié)果更為準(zhǔn)確。 |
