一種自動按照紙質(zhì)表單展現(xiàn)系統(tǒng)數(shù)據(jù)的方法及系統(tǒng)
基本信息
申請?zhí)?/td> | CN201811533895.X | 申請日 | - |
公開(公告)號 | CN109684957A | 公開(公告)日 | 2019-04-26 |
申請公布號 | CN109684957A | 申請公布日 | 2019-04-26 |
分類號 | G06K9/00(2006.01)I; G06F16/22(2019.01)I; G06F17/24(2006.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 呂軍震; 李長松; 胥洪鋒; 于國方; 劉杰; 武佳 | 申請(專利權(quán))人 | 新博卓暢技術(shù)(北京)有限公司 |
代理機(jī)構(gòu) | 北京馳納智財(cái)知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) | 代理人 | 陳常美 |
地址 | 065001 河北省廊坊市經(jīng)濟(jì)技術(shù)開發(fā)區(qū)華祥路118號 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明提供一種自動按照紙質(zhì)表單展現(xiàn)系統(tǒng)數(shù)據(jù)的方法及系統(tǒng),其中方法包括利用圖像識別技術(shù)獲取紙質(zhì)表單中的表格信息,還包括以下步驟:利用OCR和/或文本分析識別所述紙質(zhì)表單中的字符;判斷所述字符在數(shù)據(jù)庫存儲的位置,記錄所述字符所有可能的位置;生成產(chǎn)生表單的所有模型組合;讀入N個(gè)表單樣本進(jìn)行數(shù)據(jù)訓(xùn)練,記錄各字段存儲在數(shù)據(jù)庫位置的最大概率;根據(jù)選取的模型生成2N+3個(gè)數(shù)據(jù)表單進(jìn)行對比,選取能夠完全匹配的模型作為唯一解;輸入表單的業(yè)務(wù)單號生成業(yè)務(wù)表單。本發(fā)明利用綜合利用OCR、圖像識別、文本分析等技術(shù)將紙質(zhì)表單進(jìn)行錄入,自動分析、整理并與業(yè)務(wù)系統(tǒng)數(shù)據(jù)庫中的數(shù)據(jù)建立關(guān)聯(lián),達(dá)到按照紙質(zhì)表單自動生成展示頁面的目的。 |
