一種基于遷移神經(jīng)網(wǎng)絡(luò)聲學(xué)模型的語音識(shí)別系統(tǒng)及方法

基本信息

申請(qǐng)?zhí)?/td> CN201810077556.9 申請(qǐng)日 -
公開(公告)號(hào) CN110070855B 公開(公告)日 2021-07-23
申請(qǐng)公布號(hào) CN110070855B 申請(qǐng)公布日 2021-07-23
分類號(hào) G10L15/02(2006.01)I 分類 樂器;聲學(xué);
發(fā)明人 張鵬遠(yuǎn);劉丹陽;徐及;顏永紅 申請(qǐng)(專利權(quán))人 北京中科信利技術(shù)有限公司
代理機(jī)構(gòu) 北京方安思達(dá)知識(shí)產(chǎn)權(quán)代理有限公司 代理人 陳琳琳;楊青
地址 100190北京市海淀區(qū)北四環(huán)西路21號(hào)
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及一種基于遷移神經(jīng)網(wǎng)絡(luò)聲學(xué)模型的語音識(shí)別系統(tǒng)及方法,該系統(tǒng)包括:信號(hào)處理及特征提取模塊、語言模型、解碼器和遷移神經(jīng)網(wǎng)絡(luò)聲學(xué)模型;其中遷移神經(jīng)網(wǎng)絡(luò)聲學(xué)模型包括魯棒神經(jīng)網(wǎng)絡(luò)和定向神經(jīng)網(wǎng)絡(luò);本系統(tǒng)通過對(duì)魯棒神經(jīng)網(wǎng)絡(luò)模型的模型參數(shù)進(jìn)行固定,同時(shí)通過神經(jīng)網(wǎng)絡(luò)間的層間橫向連接,將魯棒聲學(xué)模型的信息傳遞到目標(biāo)聲學(xué)模型中,不僅保留了原魯棒聲學(xué)模型的性能,同時(shí)還對(duì)目標(biāo)語言做特定的優(yōu)化。解決了低資源語言的魯棒聲學(xué)模型的快速構(gòu)建的問題,通過利用數(shù)據(jù)充分的語言的聲學(xué)模型進(jìn)行模型參數(shù)遷移的方式,來提升目標(biāo)低資源語言的聲學(xué)模型性能以及訓(xùn)練的收斂速度。