一種基于遷移神經網絡聲學模型的語音識別系統(tǒng)及方法
基本信息
申請?zhí)?/td> | CN201810077556.9 | 申請日 | - |
公開(公告)號 | CN110070855B | 公開(公告)日 | 2021-07-23 |
申請公布號 | CN110070855B | 申請公布日 | 2021-07-23 |
分類號 | G10L15/02(2006.01)I | 分類 | 樂器;聲學; |
發(fā)明人 | 張鵬遠;劉丹陽;徐及;顏永紅 | 申請(專利權)人 | 北京中科信利技術有限公司 |
代理機構 | 北京方安思達知識產權代理有限公司 | 代理人 | 陳琳琳;楊青 |
地址 | 100190北京市海淀區(qū)北四環(huán)西路21號 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明涉及一種基于遷移神經網絡聲學模型的語音識別系統(tǒng)及方法,該系統(tǒng)包括:信號處理及特征提取模塊、語言模型、解碼器和遷移神經網絡聲學模型;其中遷移神經網絡聲學模型包括魯棒神經網絡和定向神經網絡;本系統(tǒng)通過對魯棒神經網絡模型的模型參數進行固定,同時通過神經網絡間的層間橫向連接,將魯棒聲學模型的信息傳遞到目標聲學模型中,不僅保留了原魯棒聲學模型的性能,同時還對目標語言做特定的優(yōu)化。解決了低資源語言的魯棒聲學模型的快速構建的問題,通過利用數據充分的語言的聲學模型進行模型參數遷移的方式,來提升目標低資源語言的聲學模型性能以及訓練的收斂速度。 |
