文檔圖像中的表格解析方法及裝置

基本信息

申請(qǐng)?zhí)?/td> CN201810162749.4 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN108416279A 公開(kāi)(公告)日 2018-08-17
申請(qǐng)公布號(hào) CN108416279A 申請(qǐng)公布日 2018-08-17
分類號(hào) G06K9/00 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 余宙;楊永智;汪賢 申請(qǐng)(專利權(quán))人 北京阿博茨科技有限公司
代理機(jī)構(gòu) 北京市領(lǐng)專知識(shí)產(chǎn)權(quán)代理有限公司 代理人 林輝輪;張玲
地址 100192 北京市海淀區(qū)學(xué)清路8號(hào)科技財(cái)富中心A座2層201
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及一種文檔圖像中的表格解析方法及裝置,所述方法包括步驟:利用預(yù)先訓(xùn)練的表格檢測(cè)模型,檢測(cè)出待解析文檔圖像中的表格區(qū)域;利用預(yù)先訓(xùn)練的文字檢測(cè)模型,檢測(cè)出該表格區(qū)域中所包含的內(nèi)部文字塊;確定表格的空間結(jié)構(gòu);根據(jù)表格的空間結(jié)構(gòu)對(duì)每個(gè)單元格中的文字塊進(jìn)行文字識(shí)別,從而解析得到可編輯的結(jié)構(gòu)化數(shù)據(jù)。本發(fā)明方法及裝置可以適用于有線表格或無(wú)線表格或黑白表格等各種形式的表格,為文檔圖像中的表格解析提供了一套既簡(jiǎn)單又有效的解決方案。