一種口語(yǔ)發(fā)音評(píng)測(cè)方法、裝置、介質(zhì)以及設(shè)備

基本信息

申請(qǐng)?zhí)?/td> CN202110545441.X 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN113345467A 公開(kāi)(公告)日 2021-09-03
申請(qǐng)公布號(hào) CN113345467A 申請(qǐng)公布日 2021-09-03
分類(lèi)號(hào) G10L25/51(2013.01)I;G10L15/02(2006.01)I;G10L25/18(2013.01)I;G10L25/24(2013.01)I 分類(lèi) 樂(lè)器;聲學(xué);
發(fā)明人 王佳珺;楊?lèi)?唐浩元;王歡良;代大明;張李 申請(qǐng)(專(zhuān)利權(quán))人 蘇州奇夢(mèng)者科技有限公司
代理機(jī)構(gòu) 蘇州銘浩知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 朱斌兵
地址 215000江蘇省蘇州市中國(guó)(江蘇)自由貿(mào)易試驗(yàn)區(qū)蘇州片區(qū)蘇州工業(yè)園區(qū)若水路388號(hào)E1905室
法律狀態(tài) -

摘要

摘要 本發(fā)明公開(kāi)了一種口語(yǔ)發(fā)音評(píng)測(cè)方法、裝置、介質(zhì)以及設(shè)備,該方法包括:從待評(píng)測(cè)口語(yǔ)中獲取待評(píng)測(cè)音頻和待評(píng)測(cè)文本;從待評(píng)測(cè)音頻中提取第一聲學(xué)特征,再將第一聲學(xué)特征進(jìn)行頻率擾動(dòng)后生成第二聲學(xué)特征;從待評(píng)測(cè)文本中生成的音素序列,再將音素序列結(jié)合HMM模型生成解碼網(wǎng)絡(luò);將第二聲學(xué)特征輸入到解碼網(wǎng)絡(luò)中得到聲學(xué)信息,利用聲學(xué)信息進(jìn)行GOP評(píng)分計(jì)算,本發(fā)明通過(guò)對(duì)音頻特征進(jìn)行預(yù)加重,加窗分幀以及頻域隨機(jī)擾動(dòng)后得到第二聲學(xué)特征,從而模擬前端信號(hào)處理造成的信號(hào)失真,提高在實(shí)際嘈雜環(huán)境下對(duì)音頻特征的提取性能;并通過(guò)待評(píng)測(cè)文本構(gòu)建解碼網(wǎng)絡(luò),結(jié)合上下文進(jìn)行單詞發(fā)音生成,提高特定發(fā)音現(xiàn)象下的發(fā)音評(píng)測(cè)正確性,確保了口語(yǔ)發(fā)音評(píng)測(cè)的準(zhǔn)確性。