橫向校對(duì)和輸出雙層PDF的方法和裝置
基本信息
申請(qǐng)?zhí)?/td> | CN201310558843.9 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN103714047B | 公開(公告)日 | 2017-10-10 |
申請(qǐng)公布號(hào) | CN103714047B | 申請(qǐng)公布日 | 2017-10-10 |
分類號(hào) | G06F17/25(2006.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 段雅東;陳永生;高志強(qiáng) | 申請(qǐng)(專利權(quán))人 | 知識(shí)產(chǎn)權(quán)出版社有限責(zé)任公司 |
代理機(jī)構(gòu) | 北京康信知識(shí)產(chǎn)權(quán)代理有限責(zé)任公司 | 代理人 | 吳貴明;張永明 |
地址 | 100088 北京市馬甸南村1號(hào) | ||
法律狀態(tài) | - |
摘要
摘要 | 一種橫向校對(duì)和輸出雙層PDF的方法和裝置,涉及文字處理領(lǐng)域。本發(fā)明實(shí)施例提供的方法,包括如下步驟:從OCR識(shí)別引擎記錄的每個(gè)字符在圖像中的外接矩形的位置導(dǎo)入行圖像和字符圖像的位置;修改錯(cuò)誤文字和修改文字位置;根據(jù)字符圖像位置和大小輸出雙層PDF文件。本發(fā)明適用于文字校對(duì)、雙層PDF文件加工系統(tǒng)。本發(fā)明為解決目前書籍資料電子化生成雙層PDF過程中文字位置校正精度低、效率低的問題而發(fā)明。利用OCR識(shí)別的文字位置信息導(dǎo)入行圖像和字符圖像的位置,在文字校對(duì)的過程中,通過拆分、合并和調(diào)整字符圖像位置,使輸出的雙層PDF文件文字層和圖像層完全重合,相對(duì)之前的雙層PDF生成方法,本發(fā)明大大減少了修改工作量,提高了雙層PDF質(zhì)量,以所見即所得的方式生成雙層PDF文件。 |
