一種基于動態(tài)規(guī)劃技術的復雜文檔比較方法

基本信息

申請?zhí)?/td> CN202011036551.5 申請日 -
公開(公告)號 CN112307737A 公開(公告)日 2021-02-02
申請公布號 CN112307737A 申請公布日 2021-02-02
分類號 G06F40/194(2020.01)I 分類 計算;推算;計數(shù);
發(fā)明人 崔海東;呂玉璽 申請(專利權)人 泰山信息科技有限公司
代理機構 北京高航知識產(chǎn)權代理有限公司 代理人 喬浩剛
地址 271000山東省泰安市泰山區(qū)明堂路泰山軟件園1-4層
法律狀態(tài) -

摘要

摘要 本發(fā)明為一種基于動態(tài)規(guī)劃技術的復雜文檔比較方法,用于對比文檔A及文檔B,包括以下步驟:將要比較的兩份文檔按照區(qū)域分成若干份,在每個區(qū)域內(nèi)部,按照區(qū)域進行分割,區(qū)域的分割根據(jù)段落層及元素層,并將相似的段落層進行元素層比較,并得出結果,將步驟3中的結果進行整理形成結果集,對包含有段落、頁眉頁腳、內(nèi)嵌文本框等復雜結構的文檔,以分區(qū)域、分層次的方式將文檔進行拆分,按照區(qū)域進行對應;對應區(qū)域內(nèi)部包含的文字、圖形、圖片等復雜元素,進行統(tǒng)一化處理,再結合動態(tài)規(guī)劃算法進行比較,得出差異部分,實現(xiàn)高效的復雜文檔比較。??