一種語(yǔ)種識(shí)別方法及系統(tǒng)
基本信息
申請(qǐng)?zhí)?/td> | CN202011338189.7 | 申請(qǐng)日 | - |
公開(kāi)(公告)號(hào) | CN112530407B | 公開(kāi)(公告)日 | 2021-07-23 |
申請(qǐng)公布號(hào) | CN112530407B | 申請(qǐng)公布日 | 2021-07-23 |
分類號(hào) | G10L15/00(2013.01)I;G10L25/03(2013.01)I;G10L25/24(2013.01)I;G10L25/78(2013.01)I;G10L15/20(2006.01)I | 分類 | 樂(lè)器;聲學(xué); |
發(fā)明人 | 馬杰 | 申請(qǐng)(專利權(quán))人 | 北京快魚電子股份公司 |
代理機(jī)構(gòu) | 北京天盾知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | 張彩珍 |
地址 | 100195北京市海淀區(qū)閔莊路3號(hào)清華科技園玉泉慧谷11棟 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明為一種語(yǔ)種識(shí)別方法及系統(tǒng),包括S0:建立背景噪音庫(kù)和人聲數(shù)據(jù)庫(kù);S100:基于背景噪音庫(kù)對(duì)人聲數(shù)據(jù)庫(kù)中語(yǔ)音數(shù)據(jù)進(jìn)行預(yù)處理;S200:對(duì)預(yù)處理后的語(yǔ)音數(shù)據(jù)進(jìn)行VAD檢測(cè),提取活動(dòng)語(yǔ)音數(shù)據(jù)的MFCC特征向量,建立人聲GMM模型;S300:對(duì)背景噪音庫(kù)中噪音數(shù)據(jù)進(jìn)行VAD檢測(cè),提取所述活動(dòng)噪音數(shù)據(jù)的MFCC特征向量,建立噪音GMM模型;S400:基于活動(dòng)語(yǔ)音數(shù)據(jù)MFCC特征向量,建立GMM?ivector語(yǔ)種識(shí)別模型,并生成語(yǔ)種特征庫(kù);S500:對(duì)待測(cè)聲音數(shù)據(jù)進(jìn)行VAD檢測(cè)并提取MFCC特征向量,基于人聲GMM模型和噪音GMM模型判斷待測(cè)聲音數(shù)據(jù)是否為人聲信號(hào);S600:若判斷待測(cè)聲音數(shù)據(jù)為人聲信號(hào),則用所述GMM?ivector語(yǔ)種識(shí)別模型提取該待測(cè)聲音數(shù)據(jù)的ivector特征,進(jìn)行語(yǔ)種識(shí)別。本發(fā)明可穩(wěn)定識(shí)別語(yǔ)種,增強(qiáng)魯棒性。 |
