一種中英混合OCR字符切割的方法及裝置
基本信息
申請(qǐng)?zhí)?/td> | CN201710226748.7 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN107067005A | 公開(公告)日 | 2017-08-18 |
申請(qǐng)公布號(hào) | CN107067005A | 申請(qǐng)公布日 | 2017-08-18 |
分類號(hào) | G06K9/34(2006.01)I;G06K9/62(2006.01)I;G06T7/11(2017.01)I;G06T7/136(2017.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 鄭華濱;潘嶸;王經(jīng)宇;黃正杰 | 申請(qǐng)(專利權(quán))人 | 深圳愛拼信息科技有限公司 |
代理機(jī)構(gòu) | - | 代理人 | - |
地址 | 518057 廣東省深圳市南山區(qū)南山街道科技園中區(qū)科苑路15號(hào)科興科學(xué)園B棟3單元1801號(hào)單元 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明涉及一種中英混合OCR字符切割的方法,該方法包括如下步驟:步驟1,獲取待切割的所述中英混合OCR字符圖像;步驟2,模型的訓(xùn)練,通過(guò)對(duì)全卷積神經(jīng)網(wǎng)絡(luò)模型的訓(xùn)練,使所述模型能夠正確預(yù)測(cè)所述圖像中每個(gè)橫坐標(biāo)像素點(diǎn)的類別,所述類別為一個(gè)二分類任務(wù),即將所述像素點(diǎn)分為切割點(diǎn)或非切割點(diǎn);步驟3,模型的使用,通過(guò)后處理流程最終給出正確的字符切割點(diǎn)。本發(fā)明將多種字體的中英混合字符切割準(zhǔn)確率提高到了98%左右,并且避免了復(fù)雜的處理流程和手工設(shè)置的規(guī)則,提高了算法的自適應(yīng)能力。 |
