機器學習模型訓練方法和裝置、文本識別方法和裝置

基本信息

申請?zhí)?/td> CN202210110721.2 申請日 -
公開(公告)號 CN114139729A 公開(公告)日 2022-03-04
申請公布號 CN114139729A 申請公布日 2022-03-04
分類號 G06N20/00(2019.01)I;G06N3/04(2006.01)I;G06V30/40(2022.01)I 分類 計算;推算;計數(shù);
發(fā)明人 劉軍;秦勇 申請(專利權)人 北京易真學思教育科技有限公司
代理機構 中國貿(mào)促會專利商標事務所有限公司 代理人 劉劍波
地址 102200北京市昌平區(qū)未來科學城英才北三街16號院16號樓401室
法律狀態(tài) -

摘要

摘要 本公開提供一種機器學習模型訓練方法和裝置、文本識別方法和裝置。機器學習模型訓練方法包括:對樣本圖像進行預設變換處理,以生成待處理圖像;將待處理圖像輸入第一機器學習模型,以得到n個特征圖,其中n個特征圖的尺寸互不相同、且均小于待處理圖像的尺寸,n為大于2的自然數(shù);將n個特征圖中除尺寸最大的特征圖之外的其它n?1個特征圖輸入第二機器學習模型,以得到識別概率矩陣;根據(jù)識別概率矩陣對第一機器學習模型和第二機器學習模型進行訓練;在n個特征圖中,選擇一個特征圖作為待處理特征圖;將待處理特征圖輸入增廣模型,以得到增廣樣本;將增廣樣本輸入第一機器學習模型,以便利用增廣樣本訓練第一機器學習模型和第二機器學習模型。