一種解析紙質(zhì)保單數(shù)據(jù)的方法

基本信息

申請?zhí)?/td> CN201910222271.4 申請日 -
公開(公告)號 CN109918679A 公開(公告)日 2019-06-21
申請公布號 CN109918679A 申請公布日 2019-06-21
分類號 G06F17/27(2006.01)I; G06F16/903(2019.01)I; G06F16/35(2019.01)I 分類 計算;推算;計數(shù);
發(fā)明人 王健榮; 曹光旺; 金鑫; 李小川 申請(專利權)人 成都肯定科技有限公司
代理機構 - 代理人 -
地址 610000 四川省成都市(四川)自由貿(mào)易試驗區(qū)成都高新區(qū)吉泰路666號3棟13層4號
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種解析紙質(zhì)保單數(shù)據(jù)的方法,識別數(shù)據(jù)并匹配到解析模板,將數(shù)據(jù)按行規(guī)整并排序,通過“最優(yōu)坐標系”算法,計算得出傾斜度坐標系公式,利用坐標系公式,使用“點到線距離”算法,計算出字段到標準線距離d,通過距離d差進行排序,使用“右最短,左排除”算法,計算出最優(yōu)值,并規(guī)整為同一行,再將同行數(shù)據(jù)分解并分類,使用“字符拆分”算法,把“粘”在一起的字段進行分組剝離,使用“字符串相似度”算法,匹配到相似度最高的字段,使用“四相匹配”算法,得出最優(yōu)的匹配結果,對匹配結果進行分類組裝,并“數(shù)據(jù)格式化”。可對OCR數(shù)據(jù)按行排序;利用專業(yè)的詞匯對識別錯誤的字段進行智能糾錯;對保單特定的數(shù)據(jù)格式進行合理格式化。