一種語(yǔ)種識(shí)別方法及系統(tǒng)

基本信息

申請(qǐng)?zhí)?/td> CN202011338189.7 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN112530407B 公開(kāi)(公告)日 2021-07-23
申請(qǐng)公布號(hào) CN112530407B 申請(qǐng)公布日 2021-07-23
分類號(hào) G10L15/00(2013.01)I;G10L25/03(2013.01)I;G10L25/24(2013.01)I;G10L25/78(2013.01)I;G10L15/20(2006.01)I 分類 樂(lè)器;聲學(xué);
發(fā)明人 馬杰 申請(qǐng)(專利權(quán))人 北京快魚電子股份公司
代理機(jī)構(gòu) 北京天盾知識(shí)產(chǎn)權(quán)代理有限公司 代理人 張彩珍
地址 100195北京市海淀區(qū)閔莊路3號(hào)清華科技園玉泉慧谷11棟
法律狀態(tài) -

摘要

摘要 本發(fā)明為一種語(yǔ)種識(shí)別方法及系統(tǒng),包括S0:建立背景噪音庫(kù)和人聲數(shù)據(jù)庫(kù);S100:基于背景噪音庫(kù)對(duì)人聲數(shù)據(jù)庫(kù)中語(yǔ)音數(shù)據(jù)進(jìn)行預(yù)處理;S200:對(duì)預(yù)處理后的語(yǔ)音數(shù)據(jù)進(jìn)行VAD檢測(cè),提取活動(dòng)語(yǔ)音數(shù)據(jù)的MFCC特征向量,建立人聲GMM模型;S300:對(duì)背景噪音庫(kù)中噪音數(shù)據(jù)進(jìn)行VAD檢測(cè),提取所述活動(dòng)噪音數(shù)據(jù)的MFCC特征向量,建立噪音GMM模型;S400:基于活動(dòng)語(yǔ)音數(shù)據(jù)MFCC特征向量,建立GMM?ivector語(yǔ)種識(shí)別模型,并生成語(yǔ)種特征庫(kù);S500:對(duì)待測(cè)聲音數(shù)據(jù)進(jìn)行VAD檢測(cè)并提取MFCC特征向量,基于人聲GMM模型和噪音GMM模型判斷待測(cè)聲音數(shù)據(jù)是否為人聲信號(hào);S600:若判斷待測(cè)聲音數(shù)據(jù)為人聲信號(hào),則用所述GMM?ivector語(yǔ)種識(shí)別模型提取該待測(cè)聲音數(shù)據(jù)的ivector特征,進(jìn)行語(yǔ)種識(shí)別。本發(fā)明可穩(wěn)定識(shí)別語(yǔ)種,增強(qiáng)魯棒性。