橫向校對和輸出雙層PDF的方法和裝置

基本信息

申請?zhí)?/td> CN201310558843.9 申請日 -
公開(公告)號 CN103714047B 公開(公告)日 2017-10-10
申請公布號 CN103714047B 申請公布日 2017-10-10
分類號 G06F17/25(2006.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 段雅東;陳永生;高志強(qiáng) 申請(專利權(quán))人 知識產(chǎn)權(quán)出版社有限責(zé)任公司
代理機(jī)構(gòu) 北京康信知識產(chǎn)權(quán)代理有限責(zé)任公司 代理人 吳貴明;張永明
地址 100088 北京市馬甸南村1號
法律狀態(tài) -

摘要

摘要 一種橫向校對和輸出雙層PDF的方法和裝置,涉及文字處理領(lǐng)域。本發(fā)明實(shí)施例提供的方法,包括如下步驟:從OCR識別引擎記錄的每個(gè)字符在圖像中的外接矩形的位置導(dǎo)入行圖像和字符圖像的位置;修改錯(cuò)誤文字和修改文字位置;根據(jù)字符圖像位置和大小輸出雙層PDF文件。本發(fā)明適用于文字校對、雙層PDF文件加工系統(tǒng)。本發(fā)明為解決目前書籍資料電子化生成雙層PDF過程中文字位置校正精度低、效率低的問題而發(fā)明。利用OCR識別的文字位置信息導(dǎo)入行圖像和字符圖像的位置,在文字校對的過程中,通過拆分、合并和調(diào)整字符圖像位置,使輸出的雙層PDF文件文字層和圖像層完全重合,相對之前的雙層PDF生成方法,本發(fā)明大大減少了修改工作量,提高了雙層PDF質(zhì)量,以所見即所得的方式生成雙層PDF文件。