一種識別PDF文件中的空格的方法

基本信息

申請?zhí)?/td> CN201210455707.2 申請日 -
公開(公告)號 CN103810148B 公開(公告)日 2016-12-21
申請公布號 CN103810148B 申請公布日 2016-12-21
分類號 G06F17/22(2006.01)I 分類 計算;推算;計數(shù);
發(fā)明人 周美玲 申請(專利權(quán))人 福建福昕軟件開發(fā)股份有限公司北京分公司
代理機(jī)構(gòu) 北京科龍寰宇知識產(chǎn)權(quán)代理有限責(zé)任公司 代理人 孫皓晨
地址 350003 福建省福州市鼓樓區(qū)軟件大道89號福州軟件園G區(qū)5號樓
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及一種識別PDF文件中的空格的方法。該方法包括:步驟1:遍歷PDF文件,記錄各對相鄰字符之間的距離;步驟2:確定各對相鄰字符之間的距離中的最小值h;步驟3:用各對相鄰字符之間的距離減去h,得到各對相鄰字符之間的相對距離;步驟4:依次判斷各對相鄰字符之間的相對距離是否小于預(yù)知的空格寬度,是則該對相鄰字符之間的空隙不是空格,否則,該對相鄰字符之間的空隙包括空格。本發(fā)明能提高相鄰字符之間是否存在空格的判斷準(zhǔn)確率。