聯(lián)結(jié)主義時(shí)間分類和截?cái)嗍阶⒁饬β?lián)合在線語(yǔ)音識(shí)別技術(shù)
基本信息
申請(qǐng)?zhí)?/td> | CN202010106791.1 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN111179918A | 公開(公告)日 | 2020-05-19 |
申請(qǐng)公布號(hào) | CN111179918A | 申請(qǐng)公布日 | 2020-05-19 |
分類號(hào) | G10L15/06;G10L15/26;G10L15/28;G10L25/24;G10L25/30 | 分類 | 樂(lè)器;聲學(xué); |
發(fā)明人 | 張鵬遠(yuǎn);繆浩然;程高峰;顏永紅 | 申請(qǐng)(專利權(quán))人 | 中科信利(廣州)技術(shù)有限公司 |
代理機(jī)構(gòu) | 北京億騰知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) | 代理人 | 中國(guó)科學(xué)院聲學(xué)研究所;中科信利(廣州)技術(shù)有限公司 |
地址 | 100190 北京市海淀區(qū)北四環(huán)西路21號(hào) | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明實(shí)施例提供了一種聯(lián)結(jié)主義時(shí)間分類和截?cái)嗍阶⒁饬β?lián)合在線語(yǔ)音識(shí)別技術(shù)。構(gòu)建了基于編碼器、解碼器、截?cái)嗍阶⒁饬吐?lián)結(jié)主義時(shí)間分類器的語(yǔ)音識(shí)別神經(jīng)網(wǎng)絡(luò)模型,采用交叉熵準(zhǔn)則和聯(lián)結(jié)主義時(shí)間分類準(zhǔn)則訓(xùn)練該神經(jīng)網(wǎng)絡(luò)模型;將語(yǔ)音流輸入解碼器,將存留的漢字序列輸入編碼器,利用截?cái)嗍阶⒁饬C(jī)制截取有效的語(yǔ)音片段;根據(jù)截取的語(yǔ)音片段,對(duì)每條存留的漢字序列預(yù)測(cè)多個(gè)漢字,并于之構(gòu)成一個(gè)新的漢字序列,并評(píng)分;聯(lián)結(jié)主義時(shí)間分類器將解碼拓展的多組漢字序列和已接收的語(yǔ)音對(duì)齊,并評(píng)分;對(duì)兩種評(píng)分取平均,對(duì)各漢字序列進(jìn)行剪枝;當(dāng)滿足終止條件時(shí)輸出識(shí)別結(jié)果。該方法很大程度提升在線語(yǔ)音識(shí)別的性能。 |
