一種表格識別方法及其系統(tǒng)

基本信息

申請?zhí)?/td> CN202010999560.8 申請日 -
公開(公告)號 CN112115884A 公開(公告)日 2020-12-22
申請公布號 CN112115884A 申請公布日 2020-12-22
分類號 G06K9/00(2006.01)I 分類 計算;推算;計數(shù);
發(fā)明人 陳鳴;劉家俊;劉占亮 申請(專利權)人 北京一覽群智數(shù)據(jù)科技有限責任公司
代理機構 北京冬瓜知識產(chǎn)權代理事務所(普通合伙) 代理人 北京一覽群智數(shù)據(jù)科技有限責任公司
地址 100080北京市海淀區(qū)丹棱街1號互聯(lián)網(wǎng)金融中心11層
法律狀態(tài) -

摘要

摘要 本發(fā)明提供了一種表格識別方法及其系統(tǒng),所述方法包括如下步驟:獲取初始表格圖像,并對所述初始表格圖像進行水平校正以生成預處理表格圖像;采用基于深度學習的物體檢測方法對所述預處理表格圖像的角點坐標進行檢測,并對表格區(qū)域的文字進行識別;基于圖神經(jīng)網(wǎng)絡的方法判斷預處理表格圖像中單元格之間的位置關系,并對所述預處理表格圖像中所包含的單元格以及文字進行結構還原。本發(fā)明的表格識別方法對需要識別的圖片清晰度要求低,可以最少程度上減少預處理階段的人工調(diào)參,而且該方法不僅可以識別封閉式表格,也可以識別開放式表格。??