文檔圖像中的表格解析方法及裝置
基本信息
申請(qǐng)?zhí)?/td> | CN201810162749.4 | 申請(qǐng)日 | - |
公開(kāi)(公告)號(hào) | CN108416279A | 公開(kāi)(公告)日 | 2018-08-17 |
申請(qǐng)公布號(hào) | CN108416279A | 申請(qǐng)公布日 | 2018-08-17 |
分類號(hào) | G06K9/00 | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 余宙;楊永智;汪賢 | 申請(qǐng)(專利權(quán))人 | 北京阿博茨科技有限公司 |
代理機(jī)構(gòu) | 北京市領(lǐng)專知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | 林輝輪;張玲 |
地址 | 100192 北京市海淀區(qū)學(xué)清路8號(hào)科技財(cái)富中心A座2層201 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明涉及一種文檔圖像中的表格解析方法及裝置,所述方法包括步驟:利用預(yù)先訓(xùn)練的表格檢測(cè)模型,檢測(cè)出待解析文檔圖像中的表格區(qū)域;利用預(yù)先訓(xùn)練的文字檢測(cè)模型,檢測(cè)出該表格區(qū)域中所包含的內(nèi)部文字塊;確定表格的空間結(jié)構(gòu);根據(jù)表格的空間結(jié)構(gòu)對(duì)每個(gè)單元格中的文字塊進(jìn)行文字識(shí)別,從而解析得到可編輯的結(jié)構(gòu)化數(shù)據(jù)。本發(fā)明方法及裝置可以適用于有線表格或無(wú)線表格或黑白表格等各種形式的表格,為文檔圖像中的表格解析提供了一套既簡(jiǎn)單又有效的解決方案。 |
