語音識別方法、裝置、計算機設(shè)備及計算機可讀存儲介質(zhì)

基本信息

申請?zhí)?/td> CN201910480466.9 申請日 -
公開(公告)號 CN110265002B 公開(公告)日 2021-07-23
申請公布號 CN110265002B 申請公布日 2021-07-23
分類號 G10L15/06(2013.01)I;G10L15/08(2006.01)I;G10L15/16(2006.01)I;G10L15/26(2006.01)I;G10L25/51(2013.01)I 分類 樂器;聲學(xué);
發(fā)明人 劉玲;歐陽鵬;尹首一;李秀東;王博 申請(專利權(quán))人 北京清微智能科技有限公司
代理機構(gòu) 北京三友知識產(chǎn)權(quán)代理有限公司 代理人 王天堯;任默聞
地址 100056北京市海淀區(qū)北四環(huán)西路9號22層2212
法律狀態(tài) -

摘要

摘要 本發(fā)明提供一種語音識別方法、裝置、計算機設(shè)備及計算機可讀存儲介質(zhì),包括:對獲取的音頻數(shù)據(jù)進行降采樣處理,獲得音頻降采樣數(shù)據(jù);將所述音頻降采樣數(shù)據(jù)分成訓(xùn)練音頻數(shù)據(jù)和測試音頻數(shù)據(jù);對二值化卷積神經(jīng)網(wǎng)絡(luò)卷積層和全連接層中的權(quán)重進行稀疏化處理,獲得稀疏化的二值化卷積神經(jīng)網(wǎng)絡(luò);利用所述訓(xùn)練音頻數(shù)據(jù),對所述稀疏化的二值化卷積神經(jīng)網(wǎng)絡(luò)進行訓(xùn)練,獲得訓(xùn)練好的二值化卷積神經(jīng)網(wǎng)絡(luò);利用所述測試音頻數(shù)據(jù),基于所述訓(xùn)練好的二值化卷積神經(jīng)網(wǎng)絡(luò)進行語音識別。由于該方案通過對二值化卷積神經(jīng)網(wǎng)絡(luò)卷積層和全連接層中的權(quán)重進行稀疏化處理,可以節(jié)省好多運算空間和時間。