一種閩南語語音識別方法、系統(tǒng)、設(shè)備及介質(zhì)

基本信息

申請?zhí)?/td> CN202110615995.2 申請日 -
公開(公告)號 CN113571045A 公開(公告)日 2021-10-29
申請公布號 CN113571045A 申請公布日 2021-10-29
分類號 G10L15/02(2006.01)I;G10L15/06(2013.01)I;G10L15/00(2013.01)I;G10L25/27(2013.01)I 分類 樂器;聲學(xué);
發(fā)明人 歐智堅(jiān);劉巖;肖吉;孫磊 申請(專利權(quán))人 北京它思智能科技有限公司
代理機(jī)構(gòu) 北京動(dòng)力號知識產(chǎn)權(quán)代理有限公司 代理人 董鋼
地址 100089北京市海淀區(qū)王莊路1號院清華同方科技大廈D座21層
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種閩南語語音識別方法、系統(tǒng)、設(shè)備及介質(zhì),使用普通話音素作為建模單元對閩南語進(jìn)行識別,相較于傳統(tǒng)的使用閩南語音素作為建模單元,大幅減少了音素序列的數(shù)量,降低了基于音素的n?gram語言模型的復(fù)雜度,降低了工作量,從而提高了建模效率;同時(shí),在目標(biāo)函數(shù)中引入條件隨機(jī)場CRF,CTC的狀態(tài)后驗(yàn)可以看作是條件隨機(jī)場的點(diǎn)勢能,狀態(tài)與狀態(tài)之間的聯(lián)系可以通過邊勢能引入,改善了詞錯(cuò)誤率水平,提高了聲學(xué)模型的性能,從而提高了識別準(zhǔn)確率。