一種基于深度學(xué)習(xí)的OCR方法

基本信息

申請(qǐng)?zhí)?/td> CN201811257203.3 申請(qǐng)日 -
公開(公告)號(hào) CN109376658B 公開(公告)日 2022-03-08
申請(qǐng)公布號(hào) CN109376658B 申請(qǐng)公布日 2022-03-08
分類號(hào) G06V30/41(2022.01)I;G06V30/19(2022.01)I;G06V30/26(2022.01)I;G06V30/148(2022.01)I;G06V30/168(2022.01)I;G06V30/18(2022.01)I;G06K9/62(2022.01)I;G06N3/04(2006.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 王慜驪;林路;桂曉雷;安通鑒;林康;陳立強(qiáng) 申請(qǐng)(專利權(quán))人 信雅達(dá)科技股份有限公司
代理機(jī)構(gòu) 杭州裕陽(yáng)聯(lián)合專利代理有限公司 代理人 張解翠
地址 310051 浙江省杭州市濱江區(qū)江南大道3888號(hào)信雅達(dá)科技大廈
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種基于深度學(xué)習(xí)的OCR方法,包含如下步驟:獲取待識(shí)別圖像;對(duì)待識(shí)別圖像進(jìn)行縮放,然后對(duì)縮放后的圖像進(jìn)行預(yù)處理,所述的預(yù)處理為銳化、灰度化、二值化、矯正傾斜、降噪、去公章中的任意一項(xiàng)或多項(xiàng);將預(yù)處理后的圖像放入深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)中,得到縮放處理后圖像的多個(gè)候選文本區(qū)域;將縮放處理后圖像的多個(gè)候選文本區(qū)域放入基于深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)中,將候選文字區(qū)域中的內(nèi)容轉(zhuǎn)換為計(jì)算機(jī)可讀的文本;將上述計(jì)算機(jī)可讀的文本放入深度學(xué)習(xí)語(yǔ)言模型中,對(duì)文本識(shí)別結(jié)果進(jìn)行校正。本發(fā)明可以實(shí)現(xiàn)影像的文字內(nèi)容的智能提取,為各行業(yè)人員提供了快速檢索以及快速獲取信息的服務(wù),提升了工作效率,識(shí)別字段準(zhǔn)確率高,提高處理速度。