一種基于動(dòng)態(tài)規(guī)劃技術(shù)的復(fù)雜文檔比較方法

基本信息

申請(qǐng)?zhí)?/td> CN202011036551.5 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN112307737A 公開(kāi)(公告)日 2021-02-02
申請(qǐng)公布號(hào) CN112307737A 申請(qǐng)公布日 2021-02-02
分類(lèi)號(hào) G06F40/194(2020.01)I 分類(lèi) 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 崔海東;呂玉璽 申請(qǐng)(專(zhuān)利權(quán))人 泰山信息科技有限公司
代理機(jī)構(gòu) 北京高航知識(shí)產(chǎn)權(quán)代理有限公司 代理人 喬浩剛
地址 271000山東省泰安市泰山區(qū)明堂路泰山軟件園1-4層
法律狀態(tài) -

摘要

摘要 本發(fā)明為一種基于動(dòng)態(tài)規(guī)劃技術(shù)的復(fù)雜文檔比較方法,用于對(duì)比文檔A及文檔B,包括以下步驟:將要比較的兩份文檔按照區(qū)域分成若干份,在每個(gè)區(qū)域內(nèi)部,按照區(qū)域進(jìn)行分割,區(qū)域的分割根據(jù)段落層及元素層,并將相似的段落層進(jìn)行元素層比較,并得出結(jié)果,將步驟3中的結(jié)果進(jìn)行整理形成結(jié)果集,對(duì)包含有段落、頁(yè)眉頁(yè)腳、內(nèi)嵌文本框等復(fù)雜結(jié)構(gòu)的文檔,以分區(qū)域、分層次的方式將文檔進(jìn)行拆分,按照區(qū)域進(jìn)行對(duì)應(yīng);對(duì)應(yīng)區(qū)域內(nèi)部包含的文字、圖形、圖片等復(fù)雜元素,進(jìn)行統(tǒng)一化處理,再結(jié)合動(dòng)態(tài)規(guī)劃算法進(jìn)行比較,得出差異部分,實(shí)現(xiàn)高效的復(fù)雜文檔比較。??