一種超短語音語種識別方法

基本信息

申請?zhí)?/td> CN202110752462.9 申請日 -
公開(公告)號 CN113327604A 公開(公告)日 2021-08-31
申請公布號 CN113327604A 申請公布日 2021-08-31
分類號 G10L15/16(2006.01)I;G10L15/20(2006.01)I;G10L15/04(2013.01)I;G10L15/00(2013.01)I;G10L15/32(2013.01)I 分類 樂器;聲學;
發(fā)明人 繆蔚;劉俊南;魏欣;王化;齊心 申請(專利權(quán))人 因諾微科技(天津)有限公司
代理機構(gòu) 天津諾德知識產(chǎn)權(quán)代理事務(wù)所(特殊普通合伙) 代理人 朱卉
地址 300000天津市濱海新區(qū)華苑產(chǎn)業(yè)區(qū)(環(huán)外)海泰發(fā)展五道16號B-6號樓-1-502
法律狀態(tài) -

摘要

摘要 一種超短語音語種識別方法,所述方法包括步驟:輸入語音信號;對所述輸入語音信號進行預處理;對所述輸入語音信號進行特征提??;使用多路差異感受野卷積神經(jīng)網(wǎng)絡(luò)模型對所述輸入語音信號進行識別。本發(fā)明提出一種超短語音語種識別方法,提供更高的響應速度以及在短語音上的識別精度,本發(fā)明使用多路時延神經(jīng)網(wǎng)絡(luò)作為主要結(jié)構(gòu),每路卷積神經(jīng)網(wǎng)絡(luò)使用不同的卷積核心,提供不同的感受野抽取特征,在深度特征上進行融合,本發(fā)明提升了模型識別精度,減小了模型參數(shù),可應用與1s的超短語音,可快速響應。