一種任意字符組合的OCR數(shù)據(jù)生成的方法

基本信息

申請(qǐng)?zhí)?/td> CN202110978686.1 申請(qǐng)日 -
公開(公告)號(hào) CN113435163A 公開(公告)日 2021-09-24
申請(qǐng)公布號(hào) CN113435163A 申請(qǐng)公布日 2021-09-24
分類號(hào) G06F40/109(2020.01)I;G06F40/242(2020.01)I;G06F40/279(2020.01)I;G06K9/20(2006.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 苗功勛;孫強(qiáng);陳姝;熊英超;韋文峰 申請(qǐng)(專利權(quán))人 南京中孚信息技術(shù)有限公司
代理機(jī)構(gòu) - 代理人 -
地址 210000江蘇省南京市浦口區(qū)浦口大道13號(hào)新城總部大廈B座21層
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了光學(xué)字符識(shí)別技術(shù)領(lǐng)域的一種任意字符組合的OCR數(shù)據(jù)生成的方法,包括通過(guò)字符字典、字體庫(kù)和語(yǔ)料庫(kù)生成字符?字體映射字典,得到字符和所有支持的字體之間的對(duì)應(yīng)關(guān)系;從語(yǔ)料庫(kù)中獲取待生成圖片的一行文本,切分文本成多個(gè)字符串,找到各個(gè)字符串與其對(duì)應(yīng)的字體;將找到的各個(gè)字符串對(duì)應(yīng)的字體進(jìn)行排列得到文字圖片;將文字圖片進(jìn)行拼接得到最終圖片;本發(fā)明改進(jìn)了以往OCR數(shù)據(jù)生成時(shí),在背景圖片上繪制指定文字的環(huán)節(jié),實(shí)現(xiàn)了任意字符組合的OCR數(shù)據(jù)生成方式,簡(jiǎn)單高效。