一種基于循環(huán)神經(jīng)網(wǎng)絡(luò)語(yǔ)言模型的在線語(yǔ)音識(shí)別方法和系統(tǒng)
基本信息
申請(qǐng)?zhí)?/td> | CN202110636164.3 | 申請(qǐng)日 | - |
公開(kāi)(公告)號(hào) | CN113380228A | 公開(kāi)(公告)日 | 2021-09-10 |
申請(qǐng)公布號(hào) | CN113380228A | 申請(qǐng)公布日 | 2021-09-10 |
分類(lèi)號(hào) | G10L15/01(2013.01)I;G10L15/02(2006.01)I;G10L15/06(2013.01)I;G10L25/18(2013.01)I;G10L25/30(2013.01)I | 分類(lèi) | 樂(lè)器;聲學(xué); |
發(fā)明人 | 歐智堅(jiān);劉巖;肖吉;孫磊 | 申請(qǐng)(專(zhuān)利權(quán))人 | 北京它思智能科技有限公司 |
代理機(jī)構(gòu) | 北京動(dòng)力號(hào)知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | 董鋼 |
地址 | 100089北京市海淀區(qū)王莊路1號(hào)院清華同方科技大廈D座21層 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明提出了一種基于循環(huán)神經(jīng)網(wǎng)絡(luò)語(yǔ)言模型的在線語(yǔ)音識(shí)別方法和系統(tǒng),所述方法包括:針對(duì)原始音頻進(jìn)行特征提取,獲得完成特征提取的語(yǔ)音音頻;將所述語(yǔ)音音頻輸入至聲學(xué)模型中進(jìn)行打分,獲得聲學(xué)模型得分;將重新打分后的語(yǔ)音音頻輸入至WFST和RNN語(yǔ)音模型中進(jìn)行解碼并重新打分,獲得解碼后的語(yǔ)音音頻;將解碼后的語(yǔ)音音頻作為識(shí)別結(jié)果進(jìn)行輸出。 |
