一種超短語音語種識別方法
基本信息
申請?zhí)?/td> | CN202110752462.9 | 申請日 | - |
公開(公告)號 | CN113327604A | 公開(公告)日 | 2021-08-31 |
申請公布號 | CN113327604A | 申請公布日 | 2021-08-31 |
分類號 | G10L15/16(2006.01)I;G10L15/20(2006.01)I;G10L15/04(2013.01)I;G10L15/00(2013.01)I;G10L15/32(2013.01)I | 分類 | 樂器;聲學; |
發(fā)明人 | 繆蔚;劉俊南;魏欣;王化;齊心 | 申請(專利權(quán))人 | 因諾微科技(天津)有限公司 |
代理機構(gòu) | 天津諾德知識產(chǎn)權(quán)代理事務(wù)所(特殊普通合伙) | 代理人 | 朱卉 |
地址 | 300000天津市濱海新區(qū)華苑產(chǎn)業(yè)區(qū)(環(huán)外)海泰發(fā)展五道16號B-6號樓-1-502 | ||
法律狀態(tài) | - |
摘要
摘要 | 一種超短語音語種識別方法,所述方法包括步驟:輸入語音信號;對所述輸入語音信號進行預處理;對所述輸入語音信號進行特征提??;使用多路差異感受野卷積神經(jīng)網(wǎng)絡(luò)模型對所述輸入語音信號進行識別。本發(fā)明提出一種超短語音語種識別方法,提供更高的響應速度以及在短語音上的識別精度,本發(fā)明使用多路時延神經(jīng)網(wǎng)絡(luò)作為主要結(jié)構(gòu),每路卷積神經(jīng)網(wǎng)絡(luò)使用不同的卷積核心,提供不同的感受野抽取特征,在深度特征上進行融合,本發(fā)明提升了模型識別精度,減小了模型參數(shù),可應用與1s的超短語音,可快速響應。 |
