識別PDF文件中文本框的方法、裝置及計(jì)算機(jī)設(shè)備及存儲介質(zhì)
基本信息
申請?zhí)?/td> | CN202110184633.2 | 申請日 | - |
公開(公告)號 | CN112818894A | 公開(公告)日 | 2021-05-18 |
申請公布號 | CN112818894A | 申請公布日 | 2021-05-18 |
分類號 | G06K9/00 | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 邢振雨 | 申請(專利權(quán))人 | 深圳萬興軟件有限公司 |
代理機(jī)構(gòu) | 深圳市精英專利事務(wù)所 | 代理人 | 李翔宇 |
地址 | 518000 廣東省深圳市南山區(qū)粵海街道軟件產(chǎn)業(yè)基地5棟D座1001 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明實(shí)施例公開了一種識別PDF文件中文本框的方法、裝置、計(jì)算機(jī)設(shè)備及存儲介質(zhì),其中方法包括獲取目標(biāo)PDF文件,并從所述目標(biāo)PDF文件中獲取目標(biāo)對象;解析所述目標(biāo)對象以獲取所述目標(biāo)對象的形狀,并根據(jù)所述目標(biāo)對象的形狀將所述目標(biāo)對象歸類至預(yù)設(shè)圖形集合中相應(yīng)的子集合中,其中,所述預(yù)設(shè)圖形集合包括多個對應(yīng)不同形狀的子集合;對所述預(yù)設(shè)圖形集合進(jìn)行處理以獲得目標(biāo)預(yù)設(shè)圖形集合;解析所述目標(biāo)預(yù)設(shè)圖形集合并判斷所述目標(biāo)預(yù)設(shè)圖形集合中的對象所對應(yīng)的圖形區(qū)域是否存在文本對象以識別出所述目標(biāo)PDF文件的文本框。本發(fā)明能夠識別并提取PDF文件中的文本框。 |
