一種多通道遠場語音識別方法
基本信息
申請?zhí)?/td> | CN201810986855.4 | 申請日 | - |
公開(公告)號 | CN110867178B | 公開(公告)日 | 2022-01-21 |
申請公布號 | CN110867178B | 申請公布日 | 2022-01-21 |
分類號 | G10L15/02(2006.01)I;G10L15/06(2013.01)I;G10L15/26(2006.01)I;G10L25/03(2013.01)I;G10L25/30(2013.01)I | 分類 | 樂器;聲學; |
發(fā)明人 | 張鵬遠;李文潔;潘接林;顏永紅 | 申請(專利權)人 | 北京中科信利技術有限公司 |
代理機構 | 北京方安思達知識產權代理有限公司 | 代理人 | 陳琳琳;劉振 |
地址 | 100190北京市海淀區(qū)北四環(huán)西路21號 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明涉及一種多通道遠場語音識別方法,其包括:步驟1)提取每個通道的遠場語音信號的語音特征,串接多個通道的語音特征,獲得語音特征向量;步驟2)計算任意兩個通道之間的GCC特征,將GCC特征與步驟1)獲得的語音特征向量拼接,獲得遠場特征向量,作為訓練遠場學生模型的訓練數(shù)據(jù);步驟3)對專家模型進行訓練,獲得訓練后的專家模型;同時采用知識升華策略,對遠場學生模型進行訓練,獲得訓練后的遠場學生模型;步驟4)將待識別語音信號的特征和GCC特征拼接,獲得拼接后的特征向量,并將其輸入至訓練后的遠場學生模型,獲得對應的遠場后驗概率向量,進而得到對應的后驗概率值,再經過維特比解碼,對待識別的語音信號進行識別。 |
