基于卷積神經(jīng)網(wǎng)絡(luò)深度學習模型的光學字符識別方法

基本信息

申請?zhí)?/td> CN201810270374.3 申請日 -
公開(公告)號 CN108681735A 公開(公告)日 2018-10-19
申請公布號 CN108681735A 申請公布日 2018-10-19
分類號 G06K9/34;G06K9/62;G06N3/08 分類 計算;推算;計數(shù);
發(fā)明人 陸成學 申請(專利權(quán))人 中科博宏(北京)科技有限公司
代理機構(gòu) - 代理人 -
地址 100083 北京市海淀區(qū)天秀路10中國農(nóng)大國際創(chuàng)業(yè)園2號樓5層5096
法律狀態(tài) -

摘要

摘要 本發(fā)明公開一種基于卷積神經(jīng)網(wǎng)絡(luò)深度學習模型的光學字符識別方法。該方法包括以下步驟:收集不同字體的常用漢字和10個阿拉伯數(shù)字以及26個英文字母數(shù)據(jù)集并將其轉(zhuǎn)換為圖片格式;對圖片進行輕微的扭曲和旋轉(zhuǎn)以增強模型的魯棒性,生成模型訓練數(shù)據(jù)庫;建立光學字符識別的深度學習模型;將訓練集圖像輸入模型,使用卷積神經(jīng)網(wǎng)絡(luò)模型通過監(jiān)督學習的方法,不斷優(yōu)化目標函數(shù),學習一個多分類器;對于新來的測試樣本,基于上一步得到的模型對其進行特征提取并應(yīng)用模型分類器得到最終分類結(jié)果。本發(fā)明對基于卷積神經(jīng)網(wǎng)絡(luò)的深度學習在光學字符識別中的應(yīng)用提出了新的模型和方法,該方法可以應(yīng)用于一般的模式分類任務(wù)中,特別是文本識別問題,本發(fā)明提出的基于深度學習的光學字符識別模型可以顯著提高字符識別的識別正確率。