一種基于深度學(xué)習(xí)的OCR方法

基本信息

申請?zhí)?/td> CN201811257203.3 申請日 -
公開(公告)號 CN109376658A 公開(公告)日 2019-02-22
申請公布號 CN109376658A 申請公布日 2019-02-22
分類號 G06K9/00;G06K9/32;G06K9/62 分類 計算;推算;計數(shù);
發(fā)明人 王慜驪;林路;桂曉雷;安通鑒;林康;陳立強 申請(專利權(quán))人 安徽省信雅達軟件工程有限公司
代理機構(gòu) 杭州求是專利事務(wù)所有限公司 代理人 賈玉霞;邱啟旺
地址 310051 浙江省杭州市濱江區(qū)江南大道3888號信雅達科技大廈
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種基于深度學(xué)習(xí)的OCR方法,包含如下步驟:獲取待識別圖像;對待識別圖像進行縮放,然后對縮放后的圖像進行預(yù)處理,所述的預(yù)處理為銳化、灰度化、二值化、矯正傾斜、降噪、去公章中的任意一項或多項;將預(yù)處理后的圖像放入深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)中,得到縮放處理后圖像的多個候選文本區(qū)域;將縮放處理后圖像的多個候選文本區(qū)域放入基于深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)中,將候選文字區(qū)域中的內(nèi)容轉(zhuǎn)換為計算機可讀的文本;將上述計算機可讀的文本放入深度學(xué)習(xí)語言模型中,對文本識別結(jié)果進行校正。本發(fā)明可以實現(xiàn)影像的文字內(nèi)容的智能提取,為各行業(yè)人員提供了快速檢索以及快速獲取信息的服務(wù),提升了工作效率,識別字段準確率高,提高處理速度。