表格處理方法、裝置、設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
基本信息
申請(qǐng)?zhí)?/td> | CN202110546088.7 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN113158987A | 公開(公告)日 | 2021-07-23 |
申請(qǐng)公布號(hào) | CN113158987A | 申請(qǐng)公布日 | 2021-07-23 |
分類號(hào) | G06K9/00;G06F40/177 | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 蘭天;董誠(chéng);何彥青;徐紅姣;許德山;潘優(yōu);劉志輝;吳振峰 | 申請(qǐng)(專利權(quán))人 | 中國(guó)科學(xué)技術(shù)信息研究所 |
代理機(jī)構(gòu) | 北京市立方律師事務(wù)所 | 代理人 | 張?bào)銓?/td> |
地址 | 100038 北京市海淀區(qū)復(fù)興路15號(hào) | ||
法律狀態(tài) | - |
摘要
摘要 | 本申請(qǐng)實(shí)施例提供了一種表格處理方法、裝置、設(shè)備及存儲(chǔ)介質(zhì),包括:獲取可攜帶文檔格式PDF文件中至少一個(gè)表格的線條集合和文本集合;根據(jù)線條集合,確定至少一個(gè)表格的行距單元格集合和實(shí)線行距單元格集合;根據(jù)行距單元格集合和實(shí)線行距單元格集合,確定合并單元格集合;將實(shí)線行距單元格集合中各實(shí)線行距單元格的坐標(biāo),以及合并單元格集合中各合并單元格的坐標(biāo),分別與文本集合中各文本的坐標(biāo)相匹配,確定各實(shí)線行距單元格對(duì)應(yīng)的文本和各合并單元格對(duì)應(yīng)的文本。該方法提升了識(shí)別各實(shí)線行距單元格對(duì)應(yīng)的文本和各合并單元格對(duì)應(yīng)的文本的準(zhǔn)確度。 |
