識別PDF文件中文本框的方法、裝置及計(jì)算機(jī)設(shè)備及存儲介質(zhì)

基本信息

申請?zhí)?/td> CN202110184633.2 申請日 -
公開(公告)號 CN112818894A 公開(公告)日 2021-05-18
申請公布號 CN112818894A 申請公布日 2021-05-18
分類號 G06K9/00 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 邢振雨 申請(專利權(quán))人 深圳萬興軟件有限公司
代理機(jī)構(gòu) 深圳市精英專利事務(wù)所 代理人 李翔宇
地址 518000 廣東省深圳市南山區(qū)粵海街道軟件產(chǎn)業(yè)基地5棟D座1001
法律狀態(tài) -

摘要

摘要 本發(fā)明實(shí)施例公開了一種識別PDF文件中文本框的方法、裝置、計(jì)算機(jī)設(shè)備及存儲介質(zhì),其中方法包括獲取目標(biāo)PDF文件,并從所述目標(biāo)PDF文件中獲取目標(biāo)對象;解析所述目標(biāo)對象以獲取所述目標(biāo)對象的形狀,并根據(jù)所述目標(biāo)對象的形狀將所述目標(biāo)對象歸類至預(yù)設(shè)圖形集合中相應(yīng)的子集合中,其中,所述預(yù)設(shè)圖形集合包括多個對應(yīng)不同形狀的子集合;對所述預(yù)設(shè)圖形集合進(jìn)行處理以獲得目標(biāo)預(yù)設(shè)圖形集合;解析所述目標(biāo)預(yù)設(shè)圖形集合并判斷所述目標(biāo)預(yù)設(shè)圖形集合中的對象所對應(yīng)的圖形區(qū)域是否存在文本對象以識別出所述目標(biāo)PDF文件的文本框。本發(fā)明能夠識別并提取PDF文件中的文本框。