PDF文件中的表格解析方法及裝置、計算設備、存儲介質(zhì)
基本信息
申請?zhí)?/td> | 2019112272550 | 申請日 | - |
公開(公告)號 | CN112287660A | 公開(公告)日 | 2021-01-29 |
申請公布號 | CN112287660A | 申請公布日 | 2021-01-29 |
分類號 | G06F40/205(2020.01)I;G06K9/00(2006.01)I | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 秦曉宏;劉煥春 | 申請(專利權(quán))人 | 上??铝植既鹦畔⒓夹g(shù)有限公司 |
代理機構(gòu) | 北京集佳知識產(chǎn)權(quán)代理有限公司 | 代理人 | 周書敏;張振軍 |
地址 | 200233上海市徐匯區(qū)宜山路700號普天信息產(chǎn)業(yè)園B2棟1504A | ||
法律狀態(tài) | - |
摘要
摘要 | 一種PDF文件中的表格解析方法及裝置、計算設備、存儲介質(zhì),所述PDF文件中的表格解析方法包括:將待識別PDF文件轉(zhuǎn)換成對應的文本文件;根據(jù)所述文本文件的轉(zhuǎn)換信息確定表格的位置;基于預設的目標關(guān)鍵詞以及所述表格的位置,從所述表格中的文本內(nèi)容提取與所述目標關(guān)鍵詞對應的目標內(nèi)容;至少輸出所述目標內(nèi)容。上述方案,能夠提高從PDF文件中解析表格內(nèi)容的準確度。?? |
