一種文本圖像中表格的結構化信息的識別方法及裝置
基本信息
申請?zhí)?/td> | CN202010079924.0 | 申請日 | - |
公開(公告)號 | CN111259854A | 公開(公告)日 | 2020-06-09 |
申請公布號 | CN111259854A | 申請公布日 | 2020-06-09 |
分類號 | G06K9/00(2006.01)I | 分類 | 計算;推算;計數; |
發(fā)明人 | 劉寧;吳志超;王靜;胡茜;董婉;申亞男 | 申請(專利權)人 | 北京愛醫(yī)生智慧醫(yī)療科技有限公司 |
代理機構 | 北京路浩知識產權代理有限公司 | 代理人 | 王宇楊 |
地址 | 102206北京市昌平區(qū)科技園區(qū)生命園路9號院1號樓205室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明實施例提供一種文本圖像中表格的結構化信息的識別方法及裝置,所述方法包括:在所述文本圖像中確定屬于同一個表格內的表格線,確定與所述表格線的方向相垂直的第一目標坐標軸;確定所述同一個表格內的初始單元格;確定相鄰兩個初始單元格的交線,構建包含所述交線的多邊形,確定所述多邊形的包圍區(qū)域內的線段像素數,并根據所述線段像素數和預設閾值的比較結果,確定是否合并相鄰兩個初始單元格;遍歷所有相鄰兩個初始單元格,并根據合并結果確定結構化信息的識別結果。所述裝置執(zhí)行上述方法。本發(fā)明實施例提供的方法及裝置,能夠自動和準確地識別文本圖像中表格的結構化信息。?? |
