表格識(shí)別方法、裝置和存儲(chǔ)介質(zhì)
基本信息
申請(qǐng)?zhí)?/td> | CN201910821308.5 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN110532968A | 公開(公告)日 | 2019-12-03 |
申請(qǐng)公布號(hào) | CN110532968A | 申請(qǐng)公布日 | 2019-12-03 |
分類號(hào) | G06K9/00 | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 侯紹東;周以晴;熊玉竹 | 申請(qǐng)(專利權(quán))人 | 蘇州美能華智能科技有限公司 |
代理機(jī)構(gòu) | 蘇州謹(jǐn)和知識(shí)產(chǎn)權(quán)代理事務(wù)所(特殊普通合伙) | 代理人 | 葉棟 |
地址 | 215123 江蘇省蘇州市蘇州工業(yè)園區(qū)金雞湖大道88號(hào)7期G1-902單元 | ||
法律狀態(tài) | - |
摘要
摘要 | 本申請(qǐng)涉及一種表格識(shí)別方法、裝置及存儲(chǔ)介質(zhì),屬于計(jì)算機(jī)技術(shù)領(lǐng)域,該方法包括:根據(jù)圖片預(yù)訓(xùn)練模型獲取目標(biāo)文件中的表格的結(jié)構(gòu)信息,結(jié)構(gòu)信息包括表格的頂點(diǎn)位置和各個(gè)頂點(diǎn)的連接關(guān)系;通過分組模型對(duì)表格中的文本內(nèi)容以單元格為單位進(jìn)行分組;通過連接模型將目標(biāo)文件中同一表格中的各個(gè)單元格做連接;根據(jù)結(jié)構(gòu)信息、劃分得到的文本分組以及識(shí)別得到的同一表格中的各個(gè)單元格,重新生成單元格的布局;根據(jù)重新生成的單元格的布局以及單元格中的內(nèi)容對(duì)單元格進(jìn)行合并;根據(jù)合并后的單元格以及各個(gè)單元格中的內(nèi)容生成目標(biāo)文件的描述信息,描述信息包括目標(biāo)文件中的表格的個(gè)數(shù),以及表格中各個(gè)單元格的位置。解決了現(xiàn)有方案中表格無法識(shí)別的問題。 |
