一種表格識別方法

基本信息

申請?zhí)?/td> CN201910692195.3 申請日 -
公開(公告)號 CN110647795A 公開(公告)日 2020-01-03
申請公布號 CN110647795A 申請公布日 2020-01-03
分類號 G06K9/00(2006.01); G06K9/32(2006.01) 分類 計算;推算;計數(shù);
發(fā)明人 程濤 申請(專利權(quán))人 正和智能網(wǎng)絡(luò)科技(廣州)有限公司
代理機(jī)構(gòu) 廣州三環(huán)專利商標(biāo)代理有限公司 代理人 正和智能網(wǎng)絡(luò)科技(廣州)有限公司
地址 510000 廣東省廣州市天河區(qū)馬場路28號之一2802房
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種表格識別方法,包括:獲取初始表格圖像,并對初始表格圖像進(jìn)行水平校正及垂直校正以生成校正表格圖像;將校正表格圖像轉(zhuǎn)換成灰度圖,生成灰度表格圖像,對灰度表格圖像進(jìn)行高斯自適應(yīng)二值化處理,生成前景掩模;采用基于組合形態(tài)學(xué)的方法對前景掩模進(jìn)行腐蝕操作及膨脹操作以提取表格線,并生成表格前景;查找表格前景的輪廓,生成表格區(qū)域;使用卷積神經(jīng)網(wǎng)絡(luò)對每個表格區(qū)域的文本圖像行進(jìn)行識別,輸出識別文字。采用本發(fā)明,對表格圖像進(jìn)行識別時進(jìn)行傾斜度校正處理,并對形狀畸變、亮度不均進(jìn)行處理,提高表格識別的準(zhǔn)確率。