一種口語(yǔ)發(fā)音評(píng)測(cè)方法、裝置、介質(zhì)以及設(shè)備
基本信息
申請(qǐng)?zhí)?/td> | CN202110545441.X | 申請(qǐng)日 | - |
公開(kāi)(公告)號(hào) | CN113345467A | 公開(kāi)(公告)日 | 2021-09-03 |
申請(qǐng)公布號(hào) | CN113345467A | 申請(qǐng)公布日 | 2021-09-03 |
分類(lèi)號(hào) | G10L25/51(2013.01)I;G10L15/02(2006.01)I;G10L25/18(2013.01)I;G10L25/24(2013.01)I | 分類(lèi) | 樂(lè)器;聲學(xué); |
發(fā)明人 | 王佳珺;楊?lèi)?唐浩元;王歡良;代大明;張李 | 申請(qǐng)(專(zhuān)利權(quán))人 | 蘇州奇夢(mèng)者科技有限公司 |
代理機(jī)構(gòu) | 蘇州銘浩知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) | 代理人 | 朱斌兵 |
地址 | 215000江蘇省蘇州市中國(guó)(江蘇)自由貿(mào)易試驗(yàn)區(qū)蘇州片區(qū)蘇州工業(yè)園區(qū)若水路388號(hào)E1905室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開(kāi)了一種口語(yǔ)發(fā)音評(píng)測(cè)方法、裝置、介質(zhì)以及設(shè)備,該方法包括:從待評(píng)測(cè)口語(yǔ)中獲取待評(píng)測(cè)音頻和待評(píng)測(cè)文本;從待評(píng)測(cè)音頻中提取第一聲學(xué)特征,再將第一聲學(xué)特征進(jìn)行頻率擾動(dòng)后生成第二聲學(xué)特征;從待評(píng)測(cè)文本中生成的音素序列,再將音素序列結(jié)合HMM模型生成解碼網(wǎng)絡(luò);將第二聲學(xué)特征輸入到解碼網(wǎng)絡(luò)中得到聲學(xué)信息,利用聲學(xué)信息進(jìn)行GOP評(píng)分計(jì)算,本發(fā)明通過(guò)對(duì)音頻特征進(jìn)行預(yù)加重,加窗分幀以及頻域隨機(jī)擾動(dòng)后得到第二聲學(xué)特征,從而模擬前端信號(hào)處理造成的信號(hào)失真,提高在實(shí)際嘈雜環(huán)境下對(duì)音頻特征的提取性能;并通過(guò)待評(píng)測(cè)文本構(gòu)建解碼網(wǎng)絡(luò),結(jié)合上下文進(jìn)行單詞發(fā)音生成,提高特定發(fā)音現(xiàn)象下的發(fā)音評(píng)測(cè)正確性,確保了口語(yǔ)發(fā)音評(píng)測(cè)的準(zhǔn)確性。 |
