一種解析紙質(zhì)保單數(shù)據(jù)的方法
基本信息
申請?zhí)?/td> | CN201910222271.4 | 申請日 | - |
公開(公告)號 | CN109918679A | 公開(公告)日 | 2019-06-21 |
申請公布號 | CN109918679A | 申請公布日 | 2019-06-21 |
分類號 | G06F17/27(2006.01)I; G06F16/903(2019.01)I; G06F16/35(2019.01)I | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 王健榮; 曹光旺; 金鑫; 李小川 | 申請(專利權)人 | 成都肯定科技有限公司 |
代理機構 | - | 代理人 | - |
地址 | 610000 四川省成都市(四川)自由貿(mào)易試驗區(qū)成都高新區(qū)吉泰路666號3棟13層4號 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種解析紙質(zhì)保單數(shù)據(jù)的方法,識別數(shù)據(jù)并匹配到解析模板,將數(shù)據(jù)按行規(guī)整并排序,通過“最優(yōu)坐標系”算法,計算得出傾斜度坐標系公式,利用坐標系公式,使用“點到線距離”算法,計算出字段到標準線距離d,通過距離d差進行排序,使用“右最短,左排除”算法,計算出最優(yōu)值,并規(guī)整為同一行,再將同行數(shù)據(jù)分解并分類,使用“字符拆分”算法,把“粘”在一起的字段進行分組剝離,使用“字符串相似度”算法,匹配到相似度最高的字段,使用“四相匹配”算法,得出最優(yōu)的匹配結果,對匹配結果進行分類組裝,并“數(shù)據(jù)格式化”。可對OCR數(shù)據(jù)按行排序;利用專業(yè)的詞匯對識別錯誤的字段進行智能糾錯;對保單特定的數(shù)據(jù)格式進行合理格式化。 |
