PDF文件中的表格解析方法及裝置、計算設備、存儲介質(zhì)

基本信息

申請?zhí)?/td> 2019112272550 申請日 -
公開(公告)號 CN112287660A 公開(公告)日 2021-01-29
申請公布號 CN112287660A 申請公布日 2021-01-29
分類號 G06F40/205(2020.01)I;G06K9/00(2006.01)I 分類 計算;推算;計數(shù);
發(fā)明人 秦曉宏;劉煥春 申請(專利權(quán))人 上??铝植既鹦畔⒓夹g(shù)有限公司
代理機構(gòu) 北京集佳知識產(chǎn)權(quán)代理有限公司 代理人 周書敏;張振軍
地址 200233上海市徐匯區(qū)宜山路700號普天信息產(chǎn)業(yè)園B2棟1504A
法律狀態(tài) -

摘要

摘要 一種PDF文件中的表格解析方法及裝置、計算設備、存儲介質(zhì),所述PDF文件中的表格解析方法包括:將待識別PDF文件轉(zhuǎn)換成對應的文本文件;根據(jù)所述文本文件的轉(zhuǎn)換信息確定表格的位置;基于預設的目標關(guān)鍵詞以及所述表格的位置,從所述表格中的文本內(nèi)容提取與所述目標關(guān)鍵詞對應的目標內(nèi)容;至少輸出所述目標內(nèi)容。上述方案,能夠提高從PDF文件中解析表格內(nèi)容的準確度。??