基于圖像處理與文字識(shí)別實(shí)現(xiàn)表格數(shù)字化處理方法及系統(tǒng)

基本信息

申請(qǐng)?zhí)?/td> CN202210525586.8 申請(qǐng)日 -
公開(公告)號(hào) CN114627482A 公開(公告)日 2022-06-14
申請(qǐng)公布號(hào) CN114627482A 申請(qǐng)公布日 2022-06-14
分類號(hào) G06V30/412(2022.01)I;G06F40/18(2020.01)I;G06F40/183(2020.01)I;G06F40/186(2020.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 吳寧遠(yuǎn);曾頤楠;劉秀娟;黃伯太;張益雄;徐宏昌;吳佳曄 申請(qǐng)(專利權(quán))人 四川升拓檢測(cè)技術(shù)股份有限公司
代理機(jī)構(gòu) 成都行之智信知識(shí)產(chǎn)權(quán)代理有限公司 代理人 -
地址 643000四川省自貢市沿灘區(qū)金川東路21號(hào)(廠房)
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了基于圖像處理與文字識(shí)別實(shí)現(xiàn)表格數(shù)字化處理方法及系統(tǒng),該方法包括:獲取待數(shù)字化處理的紙質(zhì)表格模板圖像,并將所述紙質(zhì)表格模板圖像轉(zhuǎn)換為位圖;根據(jù)所述位圖,采用OCR文字識(shí)別法對(duì)所述位圖進(jìn)行文字識(shí)別,得到OCR識(shí)別結(jié)果;通過圖像識(shí)別技術(shù)對(duì)所述位圖中的表格分離提取出每個(gè)單元格;將所述OCR識(shí)別結(jié)果綁定至對(duì)應(yīng)的單元格,得到標(biāo)定模板文件,并將所述標(biāo)定模板文件以自定義列表控件形式將表格進(jìn)行回顯;獲取待數(shù)字化處理的紙質(zhì)表格圖像,根據(jù)所述標(biāo)定模板文件,調(diào)用所述標(biāo)定模板文件的布局格式和計(jì)算規(guī)則實(shí)現(xiàn)對(duì)所述紙質(zhì)表格圖像進(jìn)行數(shù)字化轉(zhuǎn)化以及識(shí)別,得到識(shí)別結(jié)果。本發(fā)明方法簡(jiǎn)單、流程大大簡(jiǎn)化,且處理效率高。