一種基于遷移神經網絡聲學模型的語音識別系統(tǒng)及方法

基本信息

申請?zhí)?/td> CN201810077556.9 申請日 -
公開(公告)號 CN110070855B 公開(公告)日 2021-07-23
申請公布號 CN110070855B 申請公布日 2021-07-23
分類號 G10L15/02(2006.01)I 分類 樂器;聲學;
發(fā)明人 張鵬遠;劉丹陽;徐及;顏永紅 申請(專利權)人 北京中科信利技術有限公司
代理機構 北京方安思達知識產權代理有限公司 代理人 陳琳琳;楊青
地址 100190北京市海淀區(qū)北四環(huán)西路21號
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及一種基于遷移神經網絡聲學模型的語音識別系統(tǒng)及方法,該系統(tǒng)包括:信號處理及特征提取模塊、語言模型、解碼器和遷移神經網絡聲學模型;其中遷移神經網絡聲學模型包括魯棒神經網絡和定向神經網絡;本系統(tǒng)通過對魯棒神經網絡模型的模型參數進行固定,同時通過神經網絡間的層間橫向連接,將魯棒聲學模型的信息傳遞到目標聲學模型中,不僅保留了原魯棒聲學模型的性能,同時還對目標語言做特定的優(yōu)化。解決了低資源語言的魯棒聲學模型的快速構建的問題,通過利用數據充分的語言的聲學模型進行模型參數遷移的方式,來提升目標低資源語言的聲學模型性能以及訓練的收斂速度。