一種電子文檔圖文信息還原方法、存儲設備及終端
基本信息
申請?zhí)?/td> | CN201710607640.2 | 申請日 | - |
公開(公告)號 | CN107451232A | 公開(公告)日 | 2017-12-08 |
申請公布號 | CN107451232A | 申請公布日 | 2017-12-08 |
分類號 | G06F17/30;G06F17/24 | 分類 | 計算;推算;計數; |
發(fā)明人 | 鄧國盛;周宏鋒 | 申請(專利權)人 | 廣東順德德力信息科技有限公司 |
代理機構 | - | 代理人 | - |
地址 | 528305 廣東省佛山市順德區(qū)容桂容里新發(fā)路18號之三 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開的一種電子文檔圖文信息還原方法、存儲設備及終端,包括:遍歷電子文檔中的圖文元素;提取每個圖文元素的屬性,并進行存儲;采用聚類算法,將屬性相似的元素聚集在一起,形成一個群組;將每個群組內的所有元素進行合并或重組,形成新的復合元素,每一個群組對應一個新的復合元素;獲取每個新的復合元素的屬性;根據聚類迭代規(guī)則,判斷本次迭代結果是否符合人類閱讀規(guī)則;判斷聚類迭代是否完畢;將迭代完畢的分層數據進行重組,得到新的圖文信息,并進行輸出。本發(fā)明快速有效,能夠按照人類閱讀邏輯,將傳統(tǒng)的電子文檔圖文信息進行重組和還原,使得重組和還原結果能進行二次開發(fā)利用,適用于電子文檔信息提取領域。 |
