一種口語發(fā)音評測方法、裝置、介質以及設備
基本信息
申請?zhí)?/td> | CN202110545441.X | 申請日 | - |
公開(公告)號 | CN113345467A | 公開(公告)日 | 2021-09-03 |
申請公布號 | CN113345467A | 申請公布日 | 2021-09-03 |
分類號 | G10L25/51(2013.01)I;G10L15/02(2006.01)I;G10L25/18(2013.01)I;G10L25/24(2013.01)I | 分類 | 樂器;聲學; |
發(fā)明人 | 王佳珺;楊悅;唐浩元;王歡良;代大明;張李 | 申請(專利權)人 | 蘇州奇夢者科技有限公司 |
代理機構 | 蘇州銘浩知識產權代理事務所(普通合伙) | 代理人 | 朱斌兵 |
地址 | 215000江蘇省蘇州市中國(江蘇)自由貿易試驗區(qū)蘇州片區(qū)蘇州工業(yè)園區(qū)若水路388號E1905室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種口語發(fā)音評測方法、裝置、介質以及設備,該方法包括:從待評測口語中獲取待評測音頻和待評測文本;從待評測音頻中提取第一聲學特征,再將第一聲學特征進行頻率擾動后生成第二聲學特征;從待評測文本中生成的音素序列,再將音素序列結合HMM模型生成解碼網絡;將第二聲學特征輸入到解碼網絡中得到聲學信息,利用聲學信息進行GOP評分計算,本發(fā)明通過對音頻特征進行預加重,加窗分幀以及頻域隨機擾動后得到第二聲學特征,從而模擬前端信號處理造成的信號失真,提高在實際嘈雜環(huán)境下對音頻特征的提取性能;并通過待評測文本構建解碼網絡,結合上下文進行單詞發(fā)音生成,提高特定發(fā)音現象下的發(fā)音評測正確性,確保了口語發(fā)音評測的準確性。 |
