一種精簡電子書字庫的方法及電子書處理裝置
基本信息
申請(qǐng)?zhí)?/td> | CN201210348094.2 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN102880690A | 公開(公告)日 | 2013-01-16 |
申請(qǐng)公布號(hào) | CN102880690A | 申請(qǐng)公布日 | 2013-01-16 |
分類號(hào) | G06F17/30(2006.01)I;G06F17/27(2006.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 聞申生 | 申請(qǐng)(專利權(quán))人 | 北京漢儀創(chuàng)新科技股份有限公司 |
代理機(jī)構(gòu) | 北京集佳知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | 王寶筠 |
地址 | 100036 北京市海淀區(qū)翠微路2號(hào)中國印刷科學(xué)技術(shù)研究所A座 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明實(shí)施例公開了一種精簡電子書字庫的方法及電子書處理裝置,其中所述方法包括:通過解析電子書的格式描述文件獲取所述格式描述文件中的漢字內(nèi)碼,并按指定編碼順序排序,形成所述格式描述文件的碼位順序表;根據(jù)所述碼位順序表和所述電子書的原字庫文件,通過只索引所述格式描述文件中出現(xiàn)的漢字內(nèi)碼的方式生成新字庫文件;用所述新字庫文件替換所述原字庫文件,以完成電子書字庫的精簡。本發(fā)明實(shí)施例通過獲取一本電子書的漢字內(nèi)碼序列,并以此生成該電子書專用的字形字庫的方法,將該電子書用不到的字形濾掉,解決了電子書漢字字庫的數(shù)據(jù)冗余問題,使得電子書字庫文件大幅降低。 |
