一種中英混合OCR字符切割的方法及裝置

基本信息

申請(qǐng)?zhí)?/td> CN201710226748.7 申請(qǐng)日 -
公開(公告)號(hào) CN107067005A 公開(公告)日 2017-08-18
申請(qǐng)公布號(hào) CN107067005A 申請(qǐng)公布日 2017-08-18
分類號(hào) G06K9/34(2006.01)I;G06K9/62(2006.01)I;G06T7/11(2017.01)I;G06T7/136(2017.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 鄭華濱;潘嶸;王經(jīng)宇;黃正杰 申請(qǐng)(專利權(quán))人 深圳愛拼信息科技有限公司
代理機(jī)構(gòu) - 代理人 -
地址 518057 廣東省深圳市南山區(qū)南山街道科技園中區(qū)科苑路15號(hào)科興科學(xué)園B棟3單元1801號(hào)單元
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及一種中英混合OCR字符切割的方法,該方法包括如下步驟:步驟1,獲取待切割的所述中英混合OCR字符圖像;步驟2,模型的訓(xùn)練,通過(guò)對(duì)全卷積神經(jīng)網(wǎng)絡(luò)模型的訓(xùn)練,使所述模型能夠正確預(yù)測(cè)所述圖像中每個(gè)橫坐標(biāo)像素點(diǎn)的類別,所述類別為一個(gè)二分類任務(wù),即將所述像素點(diǎn)分為切割點(diǎn)或非切割點(diǎn);步驟3,模型的使用,通過(guò)后處理流程最終給出正確的字符切割點(diǎn)。本發(fā)明將多種字體的中英混合字符切割準(zhǔn)確率提高到了98%左右,并且避免了復(fù)雜的處理流程和手工設(shè)置的規(guī)則,提高了算法的自適應(yīng)能力。