特定領(lǐng)域的語音識別模型的構(gòu)建方法

基本信息

申請?zhí)?/td> CN202010413228.9 申請日 -
公開(公告)號 CN111627427A 公開(公告)日 2020-09-04
申請公布號 CN111627427A 申請公布日 2020-09-04
分類號 G10L15/06(2013.01)I;G10L15/01(2013.01)I 分類 樂器;聲學(xué);
發(fā)明人 劉利平;張欣;孔衛(wèi)東 申請(專利權(quán))人 北京青牛技術(shù)股份有限公司
代理機(jī)構(gòu) 北京元合聯(lián)合知識產(chǎn)權(quán)代理事務(wù)所(特殊普通合伙) 代理人 北京青牛技術(shù)股份有限公司
地址 100000北京市石景山區(qū)田順莊北路1號院3號樓9層901室
法律狀態(tài) -

摘要

摘要 本發(fā)明提供了一種特定領(lǐng)域的語音識別模型的構(gòu)建方法,該方法包括:S1.將特定領(lǐng)域的音頻數(shù)據(jù)進(jìn)行文本轉(zhuǎn)錄,以構(gòu)建所述音頻數(shù)據(jù)及其對應(yīng)的轉(zhuǎn)錄文本組成的訓(xùn)練集;S2.將所述訓(xùn)練集輸入一現(xiàn)有的語音識別模型,對所述語音識別模型執(zhí)行針對所述特定領(lǐng)域的遷移學(xué)習(xí)訓(xùn)練;S3.選擇所述訓(xùn)練集的一個子集,將所述子集輸入所述語音識別模型進(jìn)行語音識別測試;S4.校準(zhǔn)所述語音識別測試的輸出結(jié)果,根據(jù)校準(zhǔn)后的輸出結(jié)果更新所述子集,將所述子集輸入所述語音識別模型,對所述語音模型執(zhí)行迭代訓(xùn)練;S5.利用根據(jù)所述訓(xùn)練集生成的語言模型,對所述語音識別模型進(jìn)行超參數(shù)調(diào)整處理,獲得特定領(lǐng)域的語音識別模型。此外,本發(fā)明還提供了相應(yīng)的計算機(jī)介質(zhì)。??