聯(lián)結(jié)主義時(shí)間分類和截?cái)嗍阶⒁饬β?lián)合在線語(yǔ)音識(shí)別技術(shù)

基本信息

申請(qǐng)?zhí)?/td> CN202010106791.1 申請(qǐng)日 -
公開(公告)號(hào) CN111179918A 公開(公告)日 2020-05-19
申請(qǐng)公布號(hào) CN111179918A 申請(qǐng)公布日 2020-05-19
分類號(hào) G10L15/06;G10L15/26;G10L15/28;G10L25/24;G10L25/30 分類 樂(lè)器;聲學(xué);
發(fā)明人 張鵬遠(yuǎn);繆浩然;程高峰;顏永紅 申請(qǐng)(專利權(quán))人 中科信利(廣州)技術(shù)有限公司
代理機(jī)構(gòu) 北京億騰知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 中國(guó)科學(xué)院聲學(xué)研究所;中科信利(廣州)技術(shù)有限公司
地址 100190 北京市海淀區(qū)北四環(huán)西路21號(hào)
法律狀態(tài) -

摘要

摘要 本發(fā)明實(shí)施例提供了一種聯(lián)結(jié)主義時(shí)間分類和截?cái)嗍阶⒁饬β?lián)合在線語(yǔ)音識(shí)別技術(shù)。構(gòu)建了基于編碼器、解碼器、截?cái)嗍阶⒁饬吐?lián)結(jié)主義時(shí)間分類器的語(yǔ)音識(shí)別神經(jīng)網(wǎng)絡(luò)模型,采用交叉熵準(zhǔn)則和聯(lián)結(jié)主義時(shí)間分類準(zhǔn)則訓(xùn)練該神經(jīng)網(wǎng)絡(luò)模型;將語(yǔ)音流輸入解碼器,將存留的漢字序列輸入編碼器,利用截?cái)嗍阶⒁饬C(jī)制截取有效的語(yǔ)音片段;根據(jù)截取的語(yǔ)音片段,對(duì)每條存留的漢字序列預(yù)測(cè)多個(gè)漢字,并于之構(gòu)成一個(gè)新的漢字序列,并評(píng)分;聯(lián)結(jié)主義時(shí)間分類器將解碼拓展的多組漢字序列和已接收的語(yǔ)音對(duì)齊,并評(píng)分;對(duì)兩種評(píng)分取平均,對(duì)各漢字序列進(jìn)行剪枝;當(dāng)滿足終止條件時(shí)輸出識(shí)別結(jié)果。該方法很大程度提升在線語(yǔ)音識(shí)別的性能。