特定領(lǐng)域的語音識別模型的構(gòu)建方法
基本信息
申請?zhí)?/td> | CN202010413228.9 | 申請日 | - |
公開(公告)號 | CN111627427A | 公開(公告)日 | 2020-09-04 |
申請公布號 | CN111627427A | 申請公布日 | 2020-09-04 |
分類號 | G10L15/06(2013.01)I;G10L15/01(2013.01)I | 分類 | 樂器;聲學(xué); |
發(fā)明人 | 劉利平;張欣;孔衛(wèi)東 | 申請(專利權(quán))人 | 北京青牛技術(shù)股份有限公司 |
代理機(jī)構(gòu) | 北京元合聯(lián)合知識產(chǎn)權(quán)代理事務(wù)所(特殊普通合伙) | 代理人 | 北京青牛技術(shù)股份有限公司 |
地址 | 100000北京市石景山區(qū)田順莊北路1號院3號樓9層901室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明提供了一種特定領(lǐng)域的語音識別模型的構(gòu)建方法,該方法包括:S1.將特定領(lǐng)域的音頻數(shù)據(jù)進(jìn)行文本轉(zhuǎn)錄,以構(gòu)建所述音頻數(shù)據(jù)及其對應(yīng)的轉(zhuǎn)錄文本組成的訓(xùn)練集;S2.將所述訓(xùn)練集輸入一現(xiàn)有的語音識別模型,對所述語音識別模型執(zhí)行針對所述特定領(lǐng)域的遷移學(xué)習(xí)訓(xùn)練;S3.選擇所述訓(xùn)練集的一個子集,將所述子集輸入所述語音識別模型進(jìn)行語音識別測試;S4.校準(zhǔn)所述語音識別測試的輸出結(jié)果,根據(jù)校準(zhǔn)后的輸出結(jié)果更新所述子集,將所述子集輸入所述語音識別模型,對所述語音模型執(zhí)行迭代訓(xùn)練;S5.利用根據(jù)所述訓(xùn)練集生成的語言模型,對所述語音識別模型進(jìn)行超參數(shù)調(diào)整處理,獲得特定領(lǐng)域的語音識別模型。此外,本發(fā)明還提供了相應(yīng)的計算機(jī)介質(zhì)。?? |
