文檔轉(zhuǎn)換方法、裝置及存儲(chǔ)介質(zhì)

基本信息

申請(qǐng)?zhí)?/td> CN202210229152.3 申請(qǐng)日 -
公開(公告)號(hào) CN114626341A 公開(公告)日 2022-06-14
申請(qǐng)公布號(hào) CN114626341A 申請(qǐng)公布日 2022-06-14
分類號(hào) G06F40/151(2020.01)I;G06F16/35(2019.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 高翔;黃琳;鄭康宜;李培源;黎旭燕;熊芬;趙彥暉;耿心偉;曾源 申請(qǐng)(專利權(quán))人 深圳微眾信用科技股份有限公司
代理機(jī)構(gòu) 廣州三環(huán)專利商標(biāo)代理有限公司 代理人 -
地址 518000廣東省深圳市南山區(qū)粵海街道深圳國(guó)際軟件園一期8棟202室
法律狀態(tài) -

摘要

摘要 本申請(qǐng)實(shí)施例公開了一種文檔轉(zhuǎn)換方法、裝置及存儲(chǔ)介質(zhì),其中方法包括:獲取目標(biāo)文檔,目標(biāo)文檔為可攜帶文檔格式PDF文檔;對(duì)目標(biāo)文檔進(jìn)行分類定級(jí),確定目標(biāo)文檔對(duì)應(yīng)的目標(biāo)分類,目標(biāo)分類為文字類型,表格類型,或光學(xué)字符識(shí)別OCR類型;根據(jù)目標(biāo)分類對(duì)目標(biāo)文檔進(jìn)行處理,獲得目標(biāo)文檔對(duì)應(yīng)的表格文檔;對(duì)表格文檔進(jìn)行轉(zhuǎn)換,獲得目標(biāo)文檔對(duì)應(yīng)的字符串報(bào)文。采用本申請(qǐng)實(shí)施例的方法,能夠兼容不同類別的PDF文檔的解析過程,實(shí)現(xiàn)PDF文檔的高效率轉(zhuǎn)換。