表格識(shí)別方法、裝置和存儲(chǔ)介質(zhì)

基本信息

申請(qǐng)?zhí)?/td> CN201910821308.5 申請(qǐng)日 -
公開(公告)號(hào) CN110532968A 公開(公告)日 2019-12-03
申請(qǐng)公布號(hào) CN110532968A 申請(qǐng)公布日 2019-12-03
分類號(hào) G06K9/00 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 侯紹東;周以晴;熊玉竹 申請(qǐng)(專利權(quán))人 蘇州美能華智能科技有限公司
代理機(jī)構(gòu) 蘇州謹(jǐn)和知識(shí)產(chǎn)權(quán)代理事務(wù)所(特殊普通合伙) 代理人 葉棟
地址 215123 江蘇省蘇州市蘇州工業(yè)園區(qū)金雞湖大道88號(hào)7期G1-902單元
法律狀態(tài) -

摘要

摘要 本申請(qǐng)涉及一種表格識(shí)別方法、裝置及存儲(chǔ)介質(zhì),屬于計(jì)算機(jī)技術(shù)領(lǐng)域,該方法包括:根據(jù)圖片預(yù)訓(xùn)練模型獲取目標(biāo)文件中的表格的結(jié)構(gòu)信息,結(jié)構(gòu)信息包括表格的頂點(diǎn)位置和各個(gè)頂點(diǎn)的連接關(guān)系;通過分組模型對(duì)表格中的文本內(nèi)容以單元格為單位進(jìn)行分組;通過連接模型將目標(biāo)文件中同一表格中的各個(gè)單元格做連接;根據(jù)結(jié)構(gòu)信息、劃分得到的文本分組以及識(shí)別得到的同一表格中的各個(gè)單元格,重新生成單元格的布局;根據(jù)重新生成的單元格的布局以及單元格中的內(nèi)容對(duì)單元格進(jìn)行合并;根據(jù)合并后的單元格以及各個(gè)單元格中的內(nèi)容生成目標(biāo)文件的描述信息,描述信息包括目標(biāo)文件中的表格的個(gè)數(shù),以及表格中各個(gè)單元格的位置。解決了現(xiàn)有方案中表格無法識(shí)別的問題。