一種多通道遠(yuǎn)場(chǎng)語(yǔ)音識(shí)別方法

基本信息

申請(qǐng)?zhí)?/td> CN201810986855.4 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN110867178B 公開(kāi)(公告)日 2022-01-21
申請(qǐng)公布號(hào) CN110867178B 申請(qǐng)公布日 2022-01-21
分類(lèi)號(hào) G10L15/02(2006.01)I;G10L15/06(2013.01)I;G10L15/26(2006.01)I;G10L25/03(2013.01)I;G10L25/30(2013.01)I 分類(lèi) 樂(lè)器;聲學(xué);
發(fā)明人 張鵬遠(yuǎn);李文潔;潘接林;顏永紅 申請(qǐng)(專利權(quán))人 北京中科信利技術(shù)有限公司
代理機(jī)構(gòu) 北京方安思達(dá)知識(shí)產(chǎn)權(quán)代理有限公司 代理人 陳琳琳;劉振
地址 100190北京市海淀區(qū)北四環(huán)西路21號(hào)
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及一種多通道遠(yuǎn)場(chǎng)語(yǔ)音識(shí)別方法,其包括:步驟1)提取每個(gè)通道的遠(yuǎn)場(chǎng)語(yǔ)音信號(hào)的語(yǔ)音特征,串接多個(gè)通道的語(yǔ)音特征,獲得語(yǔ)音特征向量;步驟2)計(jì)算任意兩個(gè)通道之間的GCC特征,將GCC特征與步驟1)獲得的語(yǔ)音特征向量拼接,獲得遠(yuǎn)場(chǎng)特征向量,作為訓(xùn)練遠(yuǎn)場(chǎng)學(xué)生模型的訓(xùn)練數(shù)據(jù);步驟3)對(duì)專家模型進(jìn)行訓(xùn)練,獲得訓(xùn)練后的專家模型;同時(shí)采用知識(shí)升華策略,對(duì)遠(yuǎn)場(chǎng)學(xué)生模型進(jìn)行訓(xùn)練,獲得訓(xùn)練后的遠(yuǎn)場(chǎng)學(xué)生模型;步驟4)將待識(shí)別語(yǔ)音信號(hào)的特征和GCC特征拼接,獲得拼接后的特征向量,并將其輸入至訓(xùn)練后的遠(yuǎn)場(chǎng)學(xué)生模型,獲得對(duì)應(yīng)的遠(yuǎn)場(chǎng)后驗(yàn)概率向量,進(jìn)而得到對(duì)應(yīng)的后驗(yàn)概率值,再經(jīng)過(guò)維特比解碼,對(duì)待識(shí)別的語(yǔ)音信號(hào)進(jìn)行識(shí)別。