表格識別方法、識別系統(tǒng)及計算機(jī)裝置
基本信息
申請?zhí)?/td> | CN201810857609.9 | 申請日 | - |
公開(公告)號 | CN109086714B | 公開(公告)日 | 2020-12-04 |
申請公布號 | CN109086714B | 申請公布日 | 2020-12-04 |
分類號 | G06K9/00;G06K9/34 | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 李自豪 | 申請(專利權(quán))人 | 國科賽思(北京)科技有限公司 |
代理機(jī)構(gòu) | 北京市商泰律師事務(wù)所 | 代理人 | 黃曉軍 |
地址 | 100085 北京市海淀區(qū)安寧莊西路9號院29號樓5層507室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明提供了一種表格識別方法和系統(tǒng),屬于表格識別技術(shù)領(lǐng)域,利用基于加權(quán)RC閾值迭代的非線性對比增強(qiáng)及高斯拉普拉斯LoG算子對符合格式的表格圖像進(jìn)行二值化處理,利用基于透視變化的傾斜校正算法進(jìn)行傾斜校正;利用圖像形態(tài)學(xué)處理方法提取表格框線,對單元格進(jìn)行分割,獲取最小單元格;建立最小單元格的字符數(shù)據(jù)庫,進(jìn)行神經(jīng)網(wǎng)絡(luò)訓(xùn)練,建立表格識別模型,對表格進(jìn)行識別。本發(fā)明計算簡、速度快,可精確識別對比度較弱、圖像明暗分布不均且背景模糊的表格圖像;傾斜校正速度快、效果好,建立專有的高頻字符,訓(xùn)練專有的神經(jīng)網(wǎng)絡(luò),進(jìn)行模板匹配,提高了識別速度和精度,同時定制化神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)簡單,減少了訓(xùn)練和調(diào)優(yōu)的時間和工作量。 |
