一種語音識(shí)別方法、裝置、電子設(shè)備以及存儲(chǔ)介質(zhì)

基本信息

申請(qǐng)?zhí)?/td> CN202110610069.6 申請(qǐng)日 -
公開(公告)號(hào) CN113327586A 公開(公告)日 2021-08-31
申請(qǐng)公布號(hào) CN113327586A 申請(qǐng)公布日 2021-08-31
分類號(hào) G10L15/02(2006.01)I;G10L15/16(2006.01)I;G10L15/26(2006.01)I;G10L25/24(2013.01)I 分類 樂器;聲學(xué);
發(fā)明人 汪雪;黃石磊;程剛 申請(qǐng)(專利權(quán))人 深圳市北科瑞聲科技股份有限公司
代理機(jī)構(gòu) 深圳智匯遠(yuǎn)見知識(shí)產(chǎn)權(quán)代理有限公司 代理人 劉潔;牛悅涵
地址 518036廣東省深圳市福田區(qū)梅林街道梅都社區(qū)中康路136號(hào)深圳新一代產(chǎn)業(yè)園3棟1201-6
法律狀態(tài) -

摘要

摘要 本申請(qǐng)涉及一種語音識(shí)別方法,包括:獲取音頻數(shù)據(jù),對(duì)所述音頻數(shù)據(jù)進(jìn)行頻譜分析,生成所述音頻數(shù)據(jù)的梅爾倒譜圖;利用預(yù)先訓(xùn)練好的音頻識(shí)別模型對(duì)所述梅爾倒譜圖進(jìn)行特征提取,得到特征音頻信號(hào),并識(shí)別所述特征音頻信號(hào)的音素序列;對(duì)所述音素序列進(jìn)行文字提取,將文字提取的結(jié)果作為所述音頻數(shù)據(jù)的識(shí)別結(jié)果。此外,本申請(qǐng)還提供一種語音識(shí)別裝置、電子設(shè)備以及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)。本申請(qǐng)可以提高語音識(shí)別的準(zhǔn)確率。