基于基尼不純度的OCR版面分析方法

基本信息

申請(qǐng)?zhí)?/td> CN202110479171.7 申請(qǐng)日 -
公開(公告)號(hào) CN113221880A 公開(公告)日 2021-08-06
申請(qǐng)公布號(hào) CN113221880A 申請(qǐng)公布日 2021-08-06
分類號(hào) G06K9/32(2006.01)I;G06K9/00(2006.01)I;G06K9/62(2006.01)I;G06F40/189(2020.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 劉星辰;何盼;陳曉峰;麻沁甜 申請(qǐng)(專利權(quán))人 上海勃池信息技術(shù)有限公司
代理機(jī)構(gòu) 上??坡蓪@硎聞?wù)所(特殊普通合伙) 代理人 葉鳳
地址 201815上海市嘉定區(qū)匯源路55號(hào)8幢5層517室
法律狀態(tài) -

摘要

摘要 本發(fā)明基于基尼不純度的OCR版面分析方法,包括:獲取圖像OCR初始的含位置信息和置信分的識(shí)別結(jié)果;根據(jù)置信分將所有的識(shí)別結(jié)果分為高置信度和低置信度兩類;從圖像的左側(cè)開始,按照一定的間隔設(shè)置多條豎直分隔線,同樣地,從圖像上側(cè)開始,按照一定的間隔設(shè)置多條水平分隔線;利用豎直分隔線將識(shí)別結(jié)果分成左右兩部分,水平分隔線將識(shí)別結(jié)果分成上下兩部分;對(duì)于每一條分隔線,分別計(jì)算左右或者上下兩個(gè)部分的基尼不純度,然后根據(jù)上下/左右的基尼不純度計(jì)算總的基尼不純度;取所有分隔線中基尼不純度最小的線作為最終的分隔線;通過最終分隔線的位置和方向判斷圖像的版面,同時(shí)過濾掉高置信度文本較少一側(cè)的文本識(shí)別結(jié)果;根據(jù)過濾后的識(shí)別結(jié)果進(jìn)行字段匹配,得到最終的識(shí)別結(jié)果。