一種電子文檔圖文信息還原方法、存儲設備及終端

基本信息

申請?zhí)?/td> CN201710607640.2 申請日 -
公開(公告)號 CN107451232A 公開(公告)日 2017-12-08
申請公布號 CN107451232A 申請公布日 2017-12-08
分類號 G06F17/30;G06F17/24 分類 計算;推算;計數;
發(fā)明人 鄧國盛;周宏鋒 申請(專利權)人 廣東順德德力信息科技有限公司
代理機構 - 代理人 -
地址 528305 廣東省佛山市順德區(qū)容桂容里新發(fā)路18號之三
法律狀態(tài) -

摘要

摘要 本發(fā)明公開的一種電子文檔圖文信息還原方法、存儲設備及終端,包括:遍歷電子文檔中的圖文元素;提取每個圖文元素的屬性,并進行存儲;采用聚類算法,將屬性相似的元素聚集在一起,形成一個群組;將每個群組內的所有元素進行合并或重組,形成新的復合元素,每一個群組對應一個新的復合元素;獲取每個新的復合元素的屬性;根據聚類迭代規(guī)則,判斷本次迭代結果是否符合人類閱讀規(guī)則;判斷聚類迭代是否完畢;將迭代完畢的分層數據進行重組,得到新的圖文信息,并進行輸出。本發(fā)明快速有效,能夠按照人類閱讀邏輯,將傳統(tǒng)的電子文檔圖文信息進行重組和還原,使得重組和還原結果能進行二次開發(fā)利用,適用于電子文檔信息提取領域。