一種基于循環(huán)神經(jīng)網(wǎng)絡(luò)語(yǔ)言模型的在線語(yǔ)音識(shí)別方法和系統(tǒng)

基本信息

申請(qǐng)?zhí)?/td> CN202110636164.3 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN113380228A 公開(kāi)(公告)日 2021-09-10
申請(qǐng)公布號(hào) CN113380228A 申請(qǐng)公布日 2021-09-10
分類(lèi)號(hào) G10L15/01(2013.01)I;G10L15/02(2006.01)I;G10L15/06(2013.01)I;G10L25/18(2013.01)I;G10L25/30(2013.01)I 分類(lèi) 樂(lè)器;聲學(xué);
發(fā)明人 歐智堅(jiān);劉巖;肖吉;孫磊 申請(qǐng)(專(zhuān)利權(quán))人 北京它思智能科技有限公司
代理機(jī)構(gòu) 北京動(dòng)力號(hào)知識(shí)產(chǎn)權(quán)代理有限公司 代理人 董鋼
地址 100089北京市海淀區(qū)王莊路1號(hào)院清華同方科技大廈D座21層
法律狀態(tài) -

摘要

摘要 本發(fā)明提出了一種基于循環(huán)神經(jīng)網(wǎng)絡(luò)語(yǔ)言模型的在線語(yǔ)音識(shí)別方法和系統(tǒng),所述方法包括:針對(duì)原始音頻進(jìn)行特征提取,獲得完成特征提取的語(yǔ)音音頻;將所述語(yǔ)音音頻輸入至聲學(xué)模型中進(jìn)行打分,獲得聲學(xué)模型得分;將重新打分后的語(yǔ)音音頻輸入至WFST和RNN語(yǔ)音模型中進(jìn)行解碼并重新打分,獲得解碼后的語(yǔ)音音頻;將解碼后的語(yǔ)音音頻作為識(shí)別結(jié)果進(jìn)行輸出。