一種英語口語發(fā)音自動糾正方法和裝置

基本信息

申請?zhí)?/td> CN202110139760.0 申請日 -
公開(公告)號 CN112466279B 公開(公告)日 2021-05-18
申請公布號 CN112466279B 申請公布日 2021-05-18
分類號 G10L15/00;G10L15/06;G10L15/08;G10L15/14;G10L15/16;G10L13/04;G10L25/03 分類 樂器;聲學(xué);
發(fā)明人 王志彬 申請(專利權(quán))人 深圳市阿卡索資訊股份有限公司
代理機構(gòu) 深圳市智勝聯(lián)合知識產(chǎn)權(quán)代理有限公司 代理人 齊文劍
地址 518000 廣東省深圳市羅湖區(qū)筍崗街道筍西社區(qū)桃園路260號HALO廣場四期九層
法律狀態(tài) -

摘要

摘要 本發(fā)明實施例提供了一種英語口語發(fā)音自動糾正方法和裝置,將采集到的音頻文件轉(zhuǎn)化成數(shù)字信號,并進行降噪處理和特征提取,得到反映語音信號特征的關(guān)鍵特征參數(shù),利用預(yù)訓(xùn)練的聲學(xué)模型、語言模型及所有英文單詞和短語組成的字典語料庫建立識別網(wǎng)絡(luò),在所述識別網(wǎng)絡(luò)中搜索與所述特征矢量序列匹配度最高的詞串,將用法有誤的單詞和/或短語提取,利用語法和時態(tài)算法規(guī)則進行修正,采用所述聲學(xué)模型生成對應(yīng)的特征向量,并從預(yù)設(shè)語音素材庫中匹配與其對應(yīng)的語音素材,利用所述語音素材和所述特征向量反編碼得到目標(biāo)音頻文件。反映語音信號特征的關(guān)鍵特征參數(shù)能夠直接獲得音素序列,提高語音識別度,能幫助語音合成更準(zhǔn)確的音頻,提高人聲相似度。