一種基于深度學(xué)習(xí)的空中管制中英文語音判別方法
基本信息
申請?zhí)?/td> | CN201910654299.5 | 申請日 | - |
公開(公告)號 | CN110473520A | 公開(公告)日 | 2019-11-19 |
申請公布號 | CN110473520A | 申請公布日 | 2019-11-19 |
分類號 | G10L15/06(2013.01)I; G10L15/16(2006.01)I; G10L15/00(2013.01)I | 分類 | 樂器;聲學(xué); |
發(fā)明人 | 王耀彬 | 申請(專利權(quán))人 | 上海麥圖信息科技有限公司 |
代理機構(gòu) | - | 代理人 | - |
地址 | 200000 上海市徐匯區(qū)桂平路680號32幢527-1室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種基于深度學(xué)習(xí)的空中管制中英文語音判別方法,包括以下步驟:獲取待判別的語音信號,并將其轉(zhuǎn)換為16bit 16kHz的PCM音頻數(shù)據(jù);建立深度網(wǎng)絡(luò)模型;利用訓(xùn)練數(shù)據(jù)訓(xùn)深度網(wǎng)絡(luò)模型得到中英文語音判別引擎;其中,深度網(wǎng)絡(luò)模型使用深度殘差卷積模塊作為特征提取器,并由reshape層和全連接層對提取的特征數(shù)據(jù)進行處理,最終通過softmax分類器進行分類學(xué)習(xí),獲得判別結(jié)果。本發(fā)明采用以人工智能深度學(xué)習(xí)引擎為核心,具有極強的專業(yè)適用性和口音泛化能力,數(shù)據(jù)量依賴程度更低的優(yōu)點,在空管中英文語音的語言判別上表現(xiàn)優(yōu)異。 |
