表格識(shí)別方法、識(shí)別系統(tǒng)及計(jì)算機(jī)裝置

基本信息

申請(qǐng)?zhí)?/td> CN201810857609.9 申請(qǐng)日 -
公開(公告)號(hào) CN109086714B 公開(公告)日 2020-12-04
申請(qǐng)公布號(hào) CN109086714B 申請(qǐng)公布日 2020-12-04
分類號(hào) G06K9/00;G06K9/34 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 李自豪 申請(qǐng)(專利權(quán))人 國科賽思(北京)科技有限公司
代理機(jī)構(gòu) 北京市商泰律師事務(wù)所 代理人 黃曉軍
地址 100085 北京市海淀區(qū)安寧莊西路9號(hào)院29號(hào)樓5層507室
法律狀態(tài) -

摘要

摘要 本發(fā)明提供了一種表格識(shí)別方法和系統(tǒng),屬于表格識(shí)別技術(shù)領(lǐng)域,利用基于加權(quán)RC閾值迭代的非線性對(duì)比增強(qiáng)及高斯拉普拉斯LoG算子對(duì)符合格式的表格圖像進(jìn)行二值化處理,利用基于透視變化的傾斜校正算法進(jìn)行傾斜校正;利用圖像形態(tài)學(xué)處理方法提取表格框線,對(duì)單元格進(jìn)行分割,獲取最小單元格;建立最小單元格的字符數(shù)據(jù)庫,進(jìn)行神經(jīng)網(wǎng)絡(luò)訓(xùn)練,建立表格識(shí)別模型,對(duì)表格進(jìn)行識(shí)別。本發(fā)明計(jì)算簡、速度快,可精確識(shí)別對(duì)比度較弱、圖像明暗分布不均且背景模糊的表格圖像;傾斜校正速度快、效果好,建立專有的高頻字符,訓(xùn)練專有的神經(jīng)網(wǎng)絡(luò),進(jìn)行模板匹配,提高了識(shí)別速度和精度,同時(shí)定制化神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)簡單,減少了訓(xùn)練和調(diào)優(yōu)的時(shí)間和工作量。