一種基于神經(jīng)網(wǎng)絡(luò)模型的語音識別方法

基本信息

申請?zhí)?/td> CN202011125376.7 申請日 -
公開(公告)號 CN112259080A 公開(公告)日 2021-06-22
申請公布號 CN112259080A 申請公布日 2021-06-22
分類號 G10L15/06;G06N3/04;G06N3/08;G10L15/02;G10L15/16;G10L15/22;G10L15/26 分類 樂器;聲學(xué);
發(fā)明人 張航;祝懷垠 申請(專利權(quán))人 北京訊眾通信技術(shù)股份有限公司
代理機構(gòu) 成都四合天行知識產(chǎn)權(quán)代理有限公司 代理人 周建;王記明
地址 610000 四川省成都市雙流區(qū)東升街道龍橋路6號129棟1單元9層902號
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種基于神經(jīng)網(wǎng)絡(luò)模型的語音識別方法,包括:獲取訓(xùn)練樣本合集,提取訓(xùn)練樣本合集的第一特征參數(shù),獲得可以用于識別的神經(jīng)網(wǎng)絡(luò)模型,并建立模板庫;獲取預(yù)測樣本合集,并輸入神經(jīng)網(wǎng)絡(luò)模型,提取獲得第二特征參數(shù),將第二特征參數(shù)與模板庫中的第一特征參數(shù)進行匹配預(yù)測,獲得識別結(jié)果;其中,所述神經(jīng)網(wǎng)絡(luò)包括依序設(shè)置的卷積神經(jīng)網(wǎng)絡(luò)和循環(huán)神經(jīng)網(wǎng)絡(luò)。與現(xiàn)有技術(shù)相比,本發(fā)明提供的語音識別方法,將卷積神經(jīng)網(wǎng)絡(luò)和循環(huán)神經(jīng)網(wǎng)絡(luò)有效的組合連接,能夠在保證語音識別正確率的同時,增加網(wǎng)絡(luò)整體的學(xué)習(xí)效率和魯棒性,提高語音識別性能。