基于基尼不純度的OCR版面分析方法
基本信息
申請(qǐng)?zhí)?/td> | CN202110479171.7 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN113221880A | 公開(公告)日 | 2021-08-06 |
申請(qǐng)公布號(hào) | CN113221880A | 申請(qǐng)公布日 | 2021-08-06 |
分類號(hào) | G06K9/32(2006.01)I;G06K9/00(2006.01)I;G06K9/62(2006.01)I;G06F40/189(2020.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 劉星辰;何盼;陳曉峰;麻沁甜 | 申請(qǐng)(專利權(quán))人 | 上海勃池信息技術(shù)有限公司 |
代理機(jī)構(gòu) | 上??坡蓪@硎聞?wù)所(特殊普通合伙) | 代理人 | 葉鳳 |
地址 | 201815上海市嘉定區(qū)匯源路55號(hào)8幢5層517室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明基于基尼不純度的OCR版面分析方法,包括:獲取圖像OCR初始的含位置信息和置信分的識(shí)別結(jié)果;根據(jù)置信分將所有的識(shí)別結(jié)果分為高置信度和低置信度兩類;從圖像的左側(cè)開始,按照一定的間隔設(shè)置多條豎直分隔線,同樣地,從圖像上側(cè)開始,按照一定的間隔設(shè)置多條水平分隔線;利用豎直分隔線將識(shí)別結(jié)果分成左右兩部分,水平分隔線將識(shí)別結(jié)果分成上下兩部分;對(duì)于每一條分隔線,分別計(jì)算左右或者上下兩個(gè)部分的基尼不純度,然后根據(jù)上下/左右的基尼不純度計(jì)算總的基尼不純度;取所有分隔線中基尼不純度最小的線作為最終的分隔線;通過最終分隔線的位置和方向判斷圖像的版面,同時(shí)過濾掉高置信度文本較少一側(cè)的文本識(shí)別結(jié)果;根據(jù)過濾后的識(shí)別結(jié)果進(jìn)行字段匹配,得到最終的識(shí)別結(jié)果。 |
