噪聲環(huán)境下層級式語音降噪識別方法及系統(tǒng)
基本信息
申請?zhí)?/td> | CN201910314867.7 | 申請日 | - |
公開(公告)號 | CN110047502A | 公開(公告)日 | 2019-07-23 |
申請公布號 | CN110047502A | 申請公布日 | 2019-07-23 |
分類號 | G10L21/0208;G10L15/06;G10L15/04 | 分類 | 樂器;聲學; |
發(fā)明人 | 劉嗣平;陳婉菁;徐艷艷;賈宇康;陳孟達 | 申請(專利權)人 | 廣州九四智能科技有限公司 |
代理機構 | 北京聯(lián)瑞聯(lián)豐知識產(chǎn)權代理事務所(普通合伙) | 代理人 | 廣州九四智能科技有限公司 |
地址 | 510000 廣東省廣州市天河區(qū)棠下涌西路35號806C | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種噪聲環(huán)境下層級式語音降噪識別方法及系統(tǒng),方法包括如下步驟:設置通話常用的文本,并進行文本的錄入;使用設置好的文本建立文本數(shù)據(jù)庫;根據(jù)文本進行純凈語音和各類噪聲的錄制;將純凈語音與各類噪聲進行線性組合,建立語音數(shù)據(jù)庫;對帶噪語音進行端點檢測,檢測出有效語音的前端點和后端點,提取出有效語音;將有效語音通過層級式方法訓練語音增強深度神經(jīng)網(wǎng)絡;有效語音經(jīng)過語音增強后再提取其聲學特征;使用聲學特征訓練聲學模型;使用文本訓練語言模型;利用聲學模型和語言模型進行搜索得到最佳的識別結果序列。本發(fā)明通過對客戶的原始語音的降噪處理,能夠提高對客戶原始語音的識別準確度。 |
