一種語(yǔ)音識(shí)別方法、裝置和電子設(shè)備

基本信息

申請(qǐng)?zhí)?/td> CN202011294806.8 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN112420050A 公開(kāi)(公告)日 2021-06-18
申請(qǐng)公布號(hào) CN112420050A 申請(qǐng)公布日 2021-06-18
分類號(hào) G10L15/26;G10L15/14;G10L15/16 分類 樂(lè)器;聲學(xué);
發(fā)明人 易中華 申請(qǐng)(專利權(quán))人 北京帝派智能科技有限公司
代理機(jī)構(gòu) 北京弘權(quán)知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 郭放;許偉群
地址 100080 北京市海淀區(qū)海淀大街34號(hào)8層820室
法律狀態(tài) -

摘要

摘要 本申請(qǐng)實(shí)施例提供了一種語(yǔ)音識(shí)別方法、裝置和電子設(shè)備,能夠使用聲學(xué)模型生成第一語(yǔ)音數(shù)據(jù)對(duì)應(yīng)的第一聲學(xué)表征;使用第一語(yǔ)音數(shù)據(jù)對(duì)應(yīng)的第一文本數(shù)據(jù)和第一聲學(xué)表征訓(xùn)練數(shù)據(jù)生成器模型,以使數(shù)據(jù)生成器模型用于根據(jù)任意文本數(shù)據(jù)生成對(duì)應(yīng)的聲學(xué)表征;使用數(shù)據(jù)生成器模型生成第二文本數(shù)據(jù)對(duì)應(yīng)的第二聲學(xué)表征,第二文本數(shù)據(jù)的規(guī)模大于第一文本數(shù)據(jù);使用第二文本數(shù)據(jù)和第二聲學(xué)表征訓(xùn)練語(yǔ)言模型,以使語(yǔ)言模型用于根據(jù)聲學(xué)模型輸出的聲學(xué)表征生成對(duì)應(yīng)的文本序列。本申請(qǐng)實(shí)施例的技術(shù)方案,通過(guò)數(shù)據(jù)生成器模型增大了聲學(xué)表征的規(guī)模,使得訓(xùn)練得到的語(yǔ)音識(shí)別系統(tǒng)可以應(yīng)用于大詞匯量連續(xù)語(yǔ)音識(shí)別的場(chǎng)景中,并且具有較高的準(zhǔn)確性。