一種多通道遠場語音識別方法

基本信息

申請?zhí)?/td> CN201810986855.4 申請日 -
公開(公告)號 CN110867178B 公開(公告)日 2022-01-21
申請公布號 CN110867178B 申請公布日 2022-01-21
分類號 G10L15/02(2006.01)I;G10L15/06(2013.01)I;G10L15/26(2006.01)I;G10L25/03(2013.01)I;G10L25/30(2013.01)I 分類 樂器;聲學;
發(fā)明人 張鵬遠;李文潔;潘接林;顏永紅 申請(專利權)人 北京中科信利技術有限公司
代理機構 北京方安思達知識產權代理有限公司 代理人 陳琳琳;劉振
地址 100190北京市海淀區(qū)北四環(huán)西路21號
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及一種多通道遠場語音識別方法,其包括:步驟1)提取每個通道的遠場語音信號的語音特征,串接多個通道的語音特征,獲得語音特征向量;步驟2)計算任意兩個通道之間的GCC特征,將GCC特征與步驟1)獲得的語音特征向量拼接,獲得遠場特征向量,作為訓練遠場學生模型的訓練數(shù)據(jù);步驟3)對專家模型進行訓練,獲得訓練后的專家模型;同時采用知識升華策略,對遠場學生模型進行訓練,獲得訓練后的遠場學生模型;步驟4)將待識別語音信號的特征和GCC特征拼接,獲得拼接后的特征向量,并將其輸入至訓練后的遠場學生模型,獲得對應的遠場后驗概率向量,進而得到對應的后驗概率值,再經過維特比解碼,對待識別的語音信號進行識別。