一種精簡電子書字庫的方法及電子書處理裝置

基本信息

申請(qǐng)?zhí)?/td> CN201210348094.2 申請(qǐng)日 -
公開(公告)號(hào) CN102880690A 公開(公告)日 2013-01-16
申請(qǐng)公布號(hào) CN102880690A 申請(qǐng)公布日 2013-01-16
分類號(hào) G06F17/30(2006.01)I;G06F17/27(2006.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 聞申生 申請(qǐng)(專利權(quán))人 北京漢儀創(chuàng)新科技股份有限公司
代理機(jī)構(gòu) 北京集佳知識(shí)產(chǎn)權(quán)代理有限公司 代理人 王寶筠
地址 100036 北京市海淀區(qū)翠微路2號(hào)中國印刷科學(xué)技術(shù)研究所A座
法律狀態(tài) -

摘要

摘要 本發(fā)明實(shí)施例公開了一種精簡電子書字庫的方法及電子書處理裝置,其中所述方法包括:通過解析電子書的格式描述文件獲取所述格式描述文件中的漢字內(nèi)碼,并按指定編碼順序排序,形成所述格式描述文件的碼位順序表;根據(jù)所述碼位順序表和所述電子書的原字庫文件,通過只索引所述格式描述文件中出現(xiàn)的漢字內(nèi)碼的方式生成新字庫文件;用所述新字庫文件替換所述原字庫文件,以完成電子書字庫的精簡。本發(fā)明實(shí)施例通過獲取一本電子書的漢字內(nèi)碼序列,并以此生成該電子書專用的字形字庫的方法,將該電子書用不到的字形濾掉,解決了電子書漢字字庫的數(shù)據(jù)冗余問題,使得電子書字庫文件大幅降低。