一種文本圖像中表格的結構化信息的識別方法及裝置

基本信息

申請?zhí)?/td> CN202010079924.0 申請日 -
公開(公告)號 CN111259854A 公開(公告)日 2020-06-09
申請公布號 CN111259854A 申請公布日 2020-06-09
分類號 G06K9/00(2006.01)I 分類 計算;推算;計數;
發(fā)明人 劉寧;吳志超;王靜;胡茜;董婉;申亞男 申請(專利權)人 北京愛醫(yī)生智慧醫(yī)療科技有限公司
代理機構 北京路浩知識產權代理有限公司 代理人 王宇楊
地址 102206北京市昌平區(qū)科技園區(qū)生命園路9號院1號樓205室
法律狀態(tài) -

摘要

摘要 本發(fā)明實施例提供一種文本圖像中表格的結構化信息的識別方法及裝置,所述方法包括:在所述文本圖像中確定屬于同一個表格內的表格線,確定與所述表格線的方向相垂直的第一目標坐標軸;確定所述同一個表格內的初始單元格;確定相鄰兩個初始單元格的交線,構建包含所述交線的多邊形,確定所述多邊形的包圍區(qū)域內的線段像素數,并根據所述線段像素數和預設閾值的比較結果,確定是否合并相鄰兩個初始單元格;遍歷所有相鄰兩個初始單元格,并根據合并結果確定結構化信息的識別結果。所述裝置執(zhí)行上述方法。本發(fā)明實施例提供的方法及裝置,能夠自動和準確地識別文本圖像中表格的結構化信息。??