識(shí)別PDF文件中文本框的方法、裝置及計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)

基本信息

申請(qǐng)?zhí)?/td> CN202110184633.2 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN112818894A 公開(kāi)(公告)日 2021-05-18
申請(qǐng)公布號(hào) CN112818894A 申請(qǐng)公布日 2021-05-18
分類號(hào) G06K9/00 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 邢振雨 申請(qǐng)(專利權(quán))人 深圳萬(wàn)興軟件有限公司
代理機(jī)構(gòu) 深圳市精英專利事務(wù)所 代理人 李翔宇
地址 518000 廣東省深圳市南山區(qū)粵海街道軟件產(chǎn)業(yè)基地5棟D座1001
法律狀態(tài) -

摘要

摘要 本發(fā)明實(shí)施例公開(kāi)了一種識(shí)別PDF文件中文本框的方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì),其中方法包括獲取目標(biāo)PDF文件,并從所述目標(biāo)PDF文件中獲取目標(biāo)對(duì)象;解析所述目標(biāo)對(duì)象以獲取所述目標(biāo)對(duì)象的形狀,并根據(jù)所述目標(biāo)對(duì)象的形狀將所述目標(biāo)對(duì)象歸類至預(yù)設(shè)圖形集合中相應(yīng)的子集合中,其中,所述預(yù)設(shè)圖形集合包括多個(gè)對(duì)應(yīng)不同形狀的子集合;對(duì)所述預(yù)設(shè)圖形集合進(jìn)行處理以獲得目標(biāo)預(yù)設(shè)圖形集合;解析所述目標(biāo)預(yù)設(shè)圖形集合并判斷所述目標(biāo)預(yù)設(shè)圖形集合中的對(duì)象所對(duì)應(yīng)的圖形區(qū)域是否存在文本對(duì)象以識(shí)別出所述目標(biāo)PDF文件的文本框。本發(fā)明能夠識(shí)別并提取PDF文件中的文本框。