一種基于遷移神經(jīng)網(wǎng)絡(luò)聲學(xué)模型的語音識(shí)別系統(tǒng)及方法
基本信息
申請(qǐng)?zhí)?/td> | CN201810077556.9 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN110070855B | 公開(公告)日 | 2021-07-23 |
申請(qǐng)公布號(hào) | CN110070855B | 申請(qǐng)公布日 | 2021-07-23 |
分類號(hào) | G10L15/02(2006.01)I | 分類 | 樂器;聲學(xué); |
發(fā)明人 | 張鵬遠(yuǎn);劉丹陽;徐及;顏永紅 | 申請(qǐng)(專利權(quán))人 | 北京中科信利技術(shù)有限公司 |
代理機(jī)構(gòu) | 北京方安思達(dá)知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | 陳琳琳;楊青 |
地址 | 100190北京市海淀區(qū)北四環(huán)西路21號(hào) | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明涉及一種基于遷移神經(jīng)網(wǎng)絡(luò)聲學(xué)模型的語音識(shí)別系統(tǒng)及方法,該系統(tǒng)包括:信號(hào)處理及特征提取模塊、語言模型、解碼器和遷移神經(jīng)網(wǎng)絡(luò)聲學(xué)模型;其中遷移神經(jīng)網(wǎng)絡(luò)聲學(xué)模型包括魯棒神經(jīng)網(wǎng)絡(luò)和定向神經(jīng)網(wǎng)絡(luò);本系統(tǒng)通過對(duì)魯棒神經(jīng)網(wǎng)絡(luò)模型的模型參數(shù)進(jìn)行固定,同時(shí)通過神經(jīng)網(wǎng)絡(luò)間的層間橫向連接,將魯棒聲學(xué)模型的信息傳遞到目標(biāo)聲學(xué)模型中,不僅保留了原魯棒聲學(xué)模型的性能,同時(shí)還對(duì)目標(biāo)語言做特定的優(yōu)化。解決了低資源語言的魯棒聲學(xué)模型的快速構(gòu)建的問題,通過利用數(shù)據(jù)充分的語言的聲學(xué)模型進(jìn)行模型參數(shù)遷移的方式,來提升目標(biāo)低資源語言的聲學(xué)模型性能以及訓(xùn)練的收斂速度。 |
