一種基于機器學習的通用OCR的訓練數(shù)據(jù)生成系統(tǒng)及方法
基本信息
申請?zhí)?/td> | CN202110084710.7 | 申請日 | - |
公開(公告)號 | CN112418224B | 公開(公告)日 | 2021-04-23 |
申請公布號 | CN112418224B | 申請公布日 | 2021-04-23 |
分類號 | G06T7/11(2017.01)I;G06K9/46(2006.01)I;G06K9/32(2006.01)I;G06K9/62(2006.01)I;G06N20/00(2019.01)I;G06K9/34(2006.01)I | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 漆偉;張瑞冬;馬永霄;童永鰲;朱鵬;張浩 | 申請(專利權(quán))人 | 中國銀行股份有限公司成都錦江支行 |
代理機構(gòu) | 成都為知盾專利代理事務(wù)所(特殊普通合伙) | 代理人 | 李漢強 |
地址 | 610000四川省成都市高新區(qū)吉瑞三路99號1棟1單元20層2001號 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種基于機器學習的通用OCR的訓練數(shù)據(jù)生成系統(tǒng)及方法,該方法基于系統(tǒng)實現(xiàn)的,其步驟包括從語料庫中隨機抽取5?10個文字作為文字信息;從字體庫中隨機選擇字體生成字體信息;從圖片庫中隨機抽取背景圖片,依據(jù)通過字體信息生成的文字信息對圖片進行裁剪;對圖片背景的像素RGB值進行聚類算法分析找到聚類中心,然后從文字顏色庫中隨機抽取顏色,計算每種顏色到背景顏色值聚類中心的RGB值的距離再從距離最遠的顏色中隨機選取文字顏色;將文字信息、字體信息、背景圖片、文字顏色結(jié)合生成可直接用于文本識別模型訓練的圖片,該方法采用真實場景背景圖片,通過聚類分析來添加字體顏色,實現(xiàn)對文字識別模型的真實訓練圖片的完全自動模擬生成。?? |
