一種英語口語發(fā)音自動糾正方法和裝置
基本信息
申請?zhí)?/td> | CN202110139760.0 | 申請日 | - |
公開(公告)號 | CN112466279B | 公開(公告)日 | 2021-05-18 |
申請公布號 | CN112466279B | 申請公布日 | 2021-05-18 |
分類號 | G10L15/00;G10L15/06;G10L15/08;G10L15/14;G10L15/16;G10L13/04;G10L25/03 | 分類 | 樂器;聲學(xué); |
發(fā)明人 | 王志彬 | 申請(專利權(quán))人 | 深圳市阿卡索資訊股份有限公司 |
代理機構(gòu) | 深圳市智勝聯(lián)合知識產(chǎn)權(quán)代理有限公司 | 代理人 | 齊文劍 |
地址 | 518000 廣東省深圳市羅湖區(qū)筍崗街道筍西社區(qū)桃園路260號HALO廣場四期九層 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明實施例提供了一種英語口語發(fā)音自動糾正方法和裝置,將采集到的音頻文件轉(zhuǎn)化成數(shù)字信號,并進行降噪處理和特征提取,得到反映語音信號特征的關(guān)鍵特征參數(shù),利用預(yù)訓(xùn)練的聲學(xué)模型、語言模型及所有英文單詞和短語組成的字典語料庫建立識別網(wǎng)絡(luò),在所述識別網(wǎng)絡(luò)中搜索與所述特征矢量序列匹配度最高的詞串,將用法有誤的單詞和/或短語提取,利用語法和時態(tài)算法規(guī)則進行修正,采用所述聲學(xué)模型生成對應(yīng)的特征向量,并從預(yù)設(shè)語音素材庫中匹配與其對應(yīng)的語音素材,利用所述語音素材和所述特征向量反編碼得到目標(biāo)音頻文件。反映語音信號特征的關(guān)鍵特征參數(shù)能夠直接獲得音素序列,提高語音識別度,能幫助語音合成更準(zhǔn)確的音頻,提高人聲相似度。 |
