一種基于機(jī)器學(xué)習(xí)的通用OCR的訓(xùn)練數(shù)據(jù)生成系統(tǒng)及方法
基本信息
申請(qǐng)?zhí)?/td> | CN202110084710.7 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN112418224A | 公開(公告)日 | 2021-02-26 |
申請(qǐng)公布號(hào) | CN112418224A | 申請(qǐng)公布日 | 2021-02-26 |
分類號(hào) | G06N20/00(2019.01)I;G06T7/11(2017.01)I;G06K9/34(2006.01)I;G06K9/46(2006.01)I;G06K9/32(2006.01)I;G06K9/62(2006.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 漆偉;張瑞冬;馬永霄;童永鰲;朱鵬;張浩 | 申請(qǐng)(專利權(quán))人 | 中國銀行股份有限公司成都錦江支行 |
代理機(jī)構(gòu) | 成都為知盾專利代理事務(wù)所(特殊普通合伙) | 代理人 | 李漢強(qiáng) |
地址 | 610000四川省成都市高新區(qū)吉瑞三路99號(hào)1棟1單元20層2001號(hào) | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種基于機(jī)器學(xué)習(xí)的通用OCR的訓(xùn)練數(shù)據(jù)生成系統(tǒng)及方法,該方法基于系統(tǒng)實(shí)現(xiàn)的,其步驟包括從語料庫中隨機(jī)抽取5?10個(gè)文字作為文字信息;從字體庫中隨機(jī)選擇字體生成字體信息;從圖片庫中隨機(jī)抽取背景圖片,依據(jù)通過字體信息生成的文字信息對(duì)圖片進(jìn)行裁剪;對(duì)圖片背景的像素RGB值進(jìn)行聚類算法分析找到聚類中心,然后從文字顏色庫中隨機(jī)抽取顏色,計(jì)算每種顏色到背景顏色值聚類中心的RGB值的距離再從距離最遠(yuǎn)的顏色中隨機(jī)選取文字顏色;將文字信息、字體信息、背景圖片、文字顏色結(jié)合生成可直接用于文本識(shí)別模型訓(xùn)練的圖片,該方法采用真實(shí)場(chǎng)景背景圖片,通過聚類分析來添加字體顏色,實(shí)現(xiàn)對(duì)文字識(shí)別模型的真實(shí)訓(xùn)練圖片的完全自動(dòng)模擬生成。?? |
