一種基于機(jī)器學(xué)習(xí)的通用OCR的訓(xùn)練數(shù)據(jù)生成系統(tǒng)及方法

基本信息

申請(qǐng)?zhí)?/td> CN202110084710.7 申請(qǐng)日 -
公開(公告)號(hào) CN112418224A 公開(公告)日 2021-02-26
申請(qǐng)公布號(hào) CN112418224A 申請(qǐng)公布日 2021-02-26
分類號(hào) G06N20/00(2019.01)I;G06T7/11(2017.01)I;G06K9/34(2006.01)I;G06K9/46(2006.01)I;G06K9/32(2006.01)I;G06K9/62(2006.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 漆偉;張瑞冬;馬永霄;童永鰲;朱鵬;張浩 申請(qǐng)(專利權(quán))人 中國銀行股份有限公司成都錦江支行
代理機(jī)構(gòu) 成都為知盾專利代理事務(wù)所(特殊普通合伙) 代理人 李漢強(qiáng)
地址 610000四川省成都市高新區(qū)吉瑞三路99號(hào)1棟1單元20層2001號(hào)
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種基于機(jī)器學(xué)習(xí)的通用OCR的訓(xùn)練數(shù)據(jù)生成系統(tǒng)及方法,該方法基于系統(tǒng)實(shí)現(xiàn)的,其步驟包括從語料庫中隨機(jī)抽取5?10個(gè)文字作為文字信息;從字體庫中隨機(jī)選擇字體生成字體信息;從圖片庫中隨機(jī)抽取背景圖片,依據(jù)通過字體信息生成的文字信息對(duì)圖片進(jìn)行裁剪;對(duì)圖片背景的像素RGB值進(jìn)行聚類算法分析找到聚類中心,然后從文字顏色庫中隨機(jī)抽取顏色,計(jì)算每種顏色到背景顏色值聚類中心的RGB值的距離再從距離最遠(yuǎn)的顏色中隨機(jī)選取文字顏色;將文字信息、字體信息、背景圖片、文字顏色結(jié)合生成可直接用于文本識(shí)別模型訓(xùn)練的圖片,該方法采用真實(shí)場(chǎng)景背景圖片,通過聚類分析來添加字體顏色,實(shí)現(xiàn)對(duì)文字識(shí)別模型的真實(shí)訓(xùn)練圖片的完全自動(dòng)模擬生成。??