語音識別方法及裝置

基本信息

申請?zhí)?/td> CN201510051345.4 申請日 -
公開(公告)號 CN105989838B 公開(公告)日 2019-09-06
申請公布號 CN105989838B 申請公布日 2019-09-06
分類號 G10L15/14 分類 樂器;聲學(xué);
發(fā)明人 孫廷瑋;林福輝 申請(專利權(quán))人 芯鑫融資租賃(北京)有限責(zé)任公司
代理機構(gòu) 北京集佳知識產(chǎn)權(quán)代理有限公司 代理人 展訊通信(上海)有限公司;芯鑫融資租賃(天津)有限責(zé)任公司;芯鑫融資租賃(北京)有限責(zé)任公司
地址 300100 天津市南開區(qū)南馬路990號中糧廣場2502室
法律狀態(tài) -

摘要

摘要 一種語音識別方法及裝置,所述方法包括:將采集到的輸入聲音信號進(jìn)行處理,得到輸入聲音數(shù)據(jù);對所述輸入聲音數(shù)據(jù)進(jìn)行幾何重塑,得到降維后的所述輸入聲音數(shù)據(jù)的低維表征數(shù)據(jù);采用所述輸入聲音數(shù)據(jù)的低維表征數(shù)據(jù)與預(yù)設(shè)的降維后的聲音訓(xùn)練數(shù)據(jù)的低維表征數(shù)據(jù),計算得出所述輸入聲音數(shù)據(jù)的VAD分值,所述聲音訓(xùn)練數(shù)據(jù)的低維數(shù)據(jù)表征通過對所述聲音訓(xùn)練數(shù)據(jù)進(jìn)行幾何重塑得到;當(dāng)確定計算得出的VAD分值大于預(yù)設(shè)的分值閾值時,對所述聲音數(shù)據(jù)進(jìn)行語音識別。上述的方案可以節(jié)約語音識別的時間和計算資源。