基于圖像處理與文字識(shí)別實(shí)現(xiàn)表格數(shù)字化處理方法及系統(tǒng)
基本信息
申請(qǐng)?zhí)?/td> | CN202210525586.8 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN114627482A | 公開(公告)日 | 2022-06-14 |
申請(qǐng)公布號(hào) | CN114627482A | 申請(qǐng)公布日 | 2022-06-14 |
分類號(hào) | G06V30/412(2022.01)I;G06F40/18(2020.01)I;G06F40/183(2020.01)I;G06F40/186(2020.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 吳寧遠(yuǎn);曾頤楠;劉秀娟;黃伯太;張益雄;徐宏昌;吳佳曄 | 申請(qǐng)(專利權(quán))人 | 四川升拓檢測(cè)技術(shù)股份有限公司 |
代理機(jī)構(gòu) | 成都行之智信知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | - |
地址 | 643000四川省自貢市沿灘區(qū)金川東路21號(hào)(廠房) | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了基于圖像處理與文字識(shí)別實(shí)現(xiàn)表格數(shù)字化處理方法及系統(tǒng),該方法包括:獲取待數(shù)字化處理的紙質(zhì)表格模板圖像,并將所述紙質(zhì)表格模板圖像轉(zhuǎn)換為位圖;根據(jù)所述位圖,采用OCR文字識(shí)別法對(duì)所述位圖進(jìn)行文字識(shí)別,得到OCR識(shí)別結(jié)果;通過圖像識(shí)別技術(shù)對(duì)所述位圖中的表格分離提取出每個(gè)單元格;將所述OCR識(shí)別結(jié)果綁定至對(duì)應(yīng)的單元格,得到標(biāo)定模板文件,并將所述標(biāo)定模板文件以自定義列表控件形式將表格進(jìn)行回顯;獲取待數(shù)字化處理的紙質(zhì)表格圖像,根據(jù)所述標(biāo)定模板文件,調(diào)用所述標(biāo)定模板文件的布局格式和計(jì)算規(guī)則實(shí)現(xiàn)對(duì)所述紙質(zhì)表格圖像進(jìn)行數(shù)字化轉(zhuǎn)化以及識(shí)別,得到識(shí)別結(jié)果。本發(fā)明方法簡(jiǎn)單、流程大大簡(jiǎn)化,且處理效率高。 |
