橫向校對(duì)和輸出雙層PDF的方法和裝置

基本信息

申請(qǐng)?zhí)?/td> CN201310558843.9 申請(qǐng)日 -
公開(公告)號(hào) CN103714047B 公開(公告)日 2017-10-10
申請(qǐng)公布號(hào) CN103714047B 申請(qǐng)公布日 2017-10-10
分類號(hào) G06F17/25(2006.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 段雅東;陳永生;高志強(qiáng) 申請(qǐng)(專利權(quán))人 知識(shí)產(chǎn)權(quán)出版社有限責(zé)任公司
代理機(jī)構(gòu) 北京康信知識(shí)產(chǎn)權(quán)代理有限責(zé)任公司 代理人 吳貴明;張永明
地址 100088 北京市馬甸南村1號(hào)
法律狀態(tài) -

摘要

摘要 一種橫向校對(duì)和輸出雙層PDF的方法和裝置,涉及文字處理領(lǐng)域。本發(fā)明實(shí)施例提供的方法,包括如下步驟:從OCR識(shí)別引擎記錄的每個(gè)字符在圖像中的外接矩形的位置導(dǎo)入行圖像和字符圖像的位置;修改錯(cuò)誤文字和修改文字位置;根據(jù)字符圖像位置和大小輸出雙層PDF文件。本發(fā)明適用于文字校對(duì)、雙層PDF文件加工系統(tǒng)。本發(fā)明為解決目前書籍資料電子化生成雙層PDF過程中文字位置校正精度低、效率低的問題而發(fā)明。利用OCR識(shí)別的文字位置信息導(dǎo)入行圖像和字符圖像的位置,在文字校對(duì)的過程中,通過拆分、合并和調(diào)整字符圖像位置,使輸出的雙層PDF文件文字層和圖像層完全重合,相對(duì)之前的雙層PDF生成方法,本發(fā)明大大減少了修改工作量,提高了雙層PDF質(zhì)量,以所見即所得的方式生成雙層PDF文件。