一種基于機器學習的通用OCR的訓練數(shù)據(jù)生成系統(tǒng)及方法

基本信息

申請?zhí)?/td> CN202110084710.7 申請日 -
公開(公告)號 CN112418224B 公開(公告)日 2021-04-23
申請公布號 CN112418224B 申請公布日 2021-04-23
分類號 G06T7/11(2017.01)I;G06K9/46(2006.01)I;G06K9/32(2006.01)I;G06K9/62(2006.01)I;G06N20/00(2019.01)I;G06K9/34(2006.01)I 分類 計算;推算;計數(shù);
發(fā)明人 漆偉;張瑞冬;馬永霄;童永鰲;朱鵬;張浩 申請(專利權(quán))人 中國銀行股份有限公司成都錦江支行
代理機構(gòu) 成都為知盾專利代理事務(wù)所(特殊普通合伙) 代理人 李漢強
地址 610000四川省成都市高新區(qū)吉瑞三路99號1棟1單元20層2001號
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種基于機器學習的通用OCR的訓練數(shù)據(jù)生成系統(tǒng)及方法,該方法基于系統(tǒng)實現(xiàn)的,其步驟包括從語料庫中隨機抽取5?10個文字作為文字信息;從字體庫中隨機選擇字體生成字體信息;從圖片庫中隨機抽取背景圖片,依據(jù)通過字體信息生成的文字信息對圖片進行裁剪;對圖片背景的像素RGB值進行聚類算法分析找到聚類中心,然后從文字顏色庫中隨機抽取顏色,計算每種顏色到背景顏色值聚類中心的RGB值的距離再從距離最遠的顏色中隨機選取文字顏色;將文字信息、字體信息、背景圖片、文字顏色結(jié)合生成可直接用于文本識別模型訓練的圖片,該方法采用真實場景背景圖片,通過聚類分析來添加字體顏色,實現(xiàn)對文字識別模型的真實訓練圖片的完全自動模擬生成。??