噪聲環(huán)境下層級(jí)式語音降噪識(shí)別方法及系統(tǒng)

基本信息

申請(qǐng)?zhí)?/td> CN201910314867.7 申請(qǐng)日 -
公開(公告)號(hào) CN110047502A 公開(公告)日 2019-07-23
申請(qǐng)公布號(hào) CN110047502A 申請(qǐng)公布日 2019-07-23
分類號(hào) G10L21/0208;G10L15/06;G10L15/04 分類 樂器;聲學(xué);
發(fā)明人 劉嗣平;陳婉菁;徐艷艷;賈宇康;陳孟達(dá) 申請(qǐng)(專利權(quán))人 廣州九四智能科技有限公司
代理機(jī)構(gòu) 北京聯(lián)瑞聯(lián)豐知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 廣州九四智能科技有限公司
地址 510000 廣東省廣州市天河區(qū)棠下涌西路35號(hào)806C
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種噪聲環(huán)境下層級(jí)式語音降噪識(shí)別方法及系統(tǒng),方法包括如下步驟:設(shè)置通話常用的文本,并進(jìn)行文本的錄入;使用設(shè)置好的文本建立文本數(shù)據(jù)庫;根據(jù)文本進(jìn)行純凈語音和各類噪聲的錄制;將純凈語音與各類噪聲進(jìn)行線性組合,建立語音數(shù)據(jù)庫;對(duì)帶噪語音進(jìn)行端點(diǎn)檢測(cè),檢測(cè)出有效語音的前端點(diǎn)和后端點(diǎn),提取出有效語音;將有效語音通過層級(jí)式方法訓(xùn)練語音增強(qiáng)深度神經(jīng)網(wǎng)絡(luò);有效語音經(jīng)過語音增強(qiáng)后再提取其聲學(xué)特征;使用聲學(xué)特征訓(xùn)練聲學(xué)模型;使用文本訓(xùn)練語言模型;利用聲學(xué)模型和語言模型進(jìn)行搜索得到最佳的識(shí)別結(jié)果序列。本發(fā)明通過對(duì)客戶的原始語音的降噪處理,能夠提高對(duì)客戶原始語音的識(shí)別準(zhǔn)確度。