一種基于動(dòng)態(tài)規(guī)劃技術(shù)的復(fù)雜文檔比較方法
基本信息
申請(qǐng)?zhí)?/td> | CN202011036551.5 | 申請(qǐng)日 | - |
公開(kāi)(公告)號(hào) | CN112307737A | 公開(kāi)(公告)日 | 2021-02-02 |
申請(qǐng)公布號(hào) | CN112307737A | 申請(qǐng)公布日 | 2021-02-02 |
分類(lèi)號(hào) | G06F40/194(2020.01)I | 分類(lèi) | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 崔海東;呂玉璽 | 申請(qǐng)(專(zhuān)利權(quán))人 | 泰山信息科技有限公司 |
代理機(jī)構(gòu) | 北京高航知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | 喬浩剛 |
地址 | 271000山東省泰安市泰山區(qū)明堂路泰山軟件園1-4層 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明為一種基于動(dòng)態(tài)規(guī)劃技術(shù)的復(fù)雜文檔比較方法,用于對(duì)比文檔A及文檔B,包括以下步驟:將要比較的兩份文檔按照區(qū)域分成若干份,在每個(gè)區(qū)域內(nèi)部,按照區(qū)域進(jìn)行分割,區(qū)域的分割根據(jù)段落層及元素層,并將相似的段落層進(jìn)行元素層比較,并得出結(jié)果,將步驟3中的結(jié)果進(jìn)行整理形成結(jié)果集,對(duì)包含有段落、頁(yè)眉頁(yè)腳、內(nèi)嵌文本框等復(fù)雜結(jié)構(gòu)的文檔,以分區(qū)域、分層次的方式將文檔進(jìn)行拆分,按照區(qū)域進(jìn)行對(duì)應(yīng);對(duì)應(yīng)區(qū)域內(nèi)部包含的文字、圖形、圖片等復(fù)雜元素,進(jìn)行統(tǒng)一化處理,再結(jié)合動(dòng)態(tài)規(guī)劃算法進(jìn)行比較,得出差異部分,實(shí)現(xiàn)高效的復(fù)雜文檔比較。?? |
