表格識(shí)別方法、裝置以及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
基本信息
申請(qǐng)?zhí)?/td> | CN202011407580.8 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN112528813B | 公開(公告)日 | 2021-07-23 |
申請(qǐng)公布號(hào) | CN112528813B | 申請(qǐng)公布日 | 2021-07-23 |
分類號(hào) | G06K9/00(2006.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 陳靜 | 申請(qǐng)(專利權(quán))人 | 上海云從企業(yè)發(fā)展有限公司 |
代理機(jī)構(gòu) | 北京瀚仁知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) | 代理人 | 屠曉旭;宋寶庫(kù) |
地址 | 201203上海市浦東新區(qū)中國(guó)(上海)自由貿(mào)易試驗(yàn)區(qū)祖沖之路1077號(hào)2幢1135-A室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明涉及表格識(shí)別技術(shù)領(lǐng)域,具體提供了一種表格識(shí)別方法,旨在解決現(xiàn)有表格識(shí)別方法泛化性差、精準(zhǔn)度不佳的技術(shù)問題。根據(jù)本發(fā)明實(shí)施例的方法,可以采用預(yù)設(shè)的圖像識(shí)別模型獲取待識(shí)別表格圖像的表格線前景圖和文本前景圖;根據(jù)表格線前景圖獲取待識(shí)別表格圖像的表格結(jié)構(gòu);根據(jù)單元格的位置、第一文本行位置和第二文本行位置,獲取與單元格關(guān)聯(lián)的最終的文本行位置;根據(jù)最終的文本行位置從待識(shí)別表格圖像中獲取相關(guān)聯(lián)單元格對(duì)應(yīng)的文本行圖像,對(duì)文本行圖像進(jìn)行文本識(shí)別并且將識(shí)別出的文本信息存儲(chǔ)至單元格內(nèi),以形成識(shí)別后的表格。通過上述步驟,可以提高表格識(shí)別的精準(zhǔn)度,并且泛化性好。 |
