基于端到端深度學(xué)習(xí)模型的語(yǔ)音識(shí)別方法及系統(tǒng)

基本信息

申請(qǐng)?zhí)?/td> CN201810739424.8 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN109147766A 公開(kāi)(公告)日 2019-01-04
申請(qǐng)公布號(hào) CN109147766A 申請(qǐng)公布日 2019-01-04
分類號(hào) G10L15/06;G06N20/00 分類 樂(lè)器;聲學(xué);
發(fā)明人 趙明 申請(qǐng)(專利權(quán))人 北京愛(ài)醫(yī)聲科技有限公司
代理機(jī)構(gòu) 北京鴻元知識(shí)產(chǎn)權(quán)代理有限公司 代理人 北京愛(ài)醫(yī)聲科技有限公司
地址 100095 北京市海淀區(qū)北清路164號(hào)17-27號(hào)院154號(hào)
法律狀態(tài) -

摘要

摘要 一種基于端到端深度學(xué)習(xí)模型的語(yǔ)音識(shí)別方法,包括以下步驟:把發(fā)音相近的韻母映射到同一個(gè)編碼,把發(fā)音相近的聲母映射到同一個(gè)編碼,形成規(guī)則映射表;用規(guī)則映射表對(duì)語(yǔ)料進(jìn)行數(shù)據(jù)編碼,把語(yǔ)料的漢字利用規(guī)則映射表中編碼進(jìn)行表示;對(duì)編碼后的語(yǔ)料使用混合式端到端模型訓(xùn)練,混合式端到端模型包括“拼音”端到端模型和“音素”端到端模型,得到“拼音”和“音素”聲學(xué)模型;用規(guī)則映射表對(duì)將要應(yīng)用的多個(gè)詞匯進(jìn)行編碼,形成詞匯庫(kù);使用聲學(xué)模型識(shí)別語(yǔ)音;使用編輯距離對(duì)比聲學(xué)模型輸出的編碼和詞匯庫(kù)內(nèi)詞匯的編碼,找到最小編輯距離,對(duì)應(yīng)的詞匯就是識(shí)別結(jié)果。本方法提升了系統(tǒng)的識(shí)別效率。