基于端到端深度學(xué)習(xí)模型的語音識(shí)別方法及系統(tǒng)
基本信息
申請(qǐng)?zhí)?/td> | CN201810739424.8 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN109147766B | 公開(公告)日 | 2019-01-04 |
申請(qǐng)公布號(hào) | CN109147766B | 申請(qǐng)公布日 | 2019-01-04 |
分類號(hào) | G10L15/06(2013.01)I;G06N20/00(2019.01)I | 分類 | - |
發(fā)明人 | 趙明 | 申請(qǐng)(專利權(quán))人 | 北京愛醫(yī)聲科技有限公司 |
代理機(jī)構(gòu) | 北京鴻元知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | 北京愛醫(yī)聲科技有限公司 |
地址 | 100095北京市海淀區(qū)北清路164號(hào)17-27號(hào)院154號(hào) | ||
法律狀態(tài) | - |
摘要
摘要 | 一種基于端到端深度學(xué)習(xí)模型的語音識(shí)別方法,包括以下步驟:把發(fā)音相近的韻母映射到同一個(gè)編碼,把發(fā)音相近的聲母映射到同一個(gè)編碼,形成規(guī)則映射表;用規(guī)則映射表對(duì)語料進(jìn)行數(shù)據(jù)編碼,把語料的漢字利用規(guī)則映射表中編碼進(jìn)行表示;對(duì)編碼后的語料使用混合式端到端模型訓(xùn)練,混合式端到端模型包括“拼音”端到端模型和“音素”端到端模型,得到“拼音”和“音素”聲學(xué)模型;用規(guī)則映射表對(duì)將要應(yīng)用的多個(gè)詞匯進(jìn)行編碼,形成詞匯庫(kù);使用聲學(xué)模型識(shí)別語音;使用編輯距離對(duì)比聲學(xué)模型輸出的編碼和詞匯庫(kù)內(nèi)詞匯的編碼,找到最小編輯距離,對(duì)應(yīng)的詞匯就是識(shí)別結(jié)果。本方法提升了系統(tǒng)的識(shí)別效率。?? |
