多文件格式版式文檔的對(duì)比方法
基本信息
申請(qǐng)?zhí)?/td> | CN202011530649.6 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN112395852A | 公開(公告)日 | 2021-02-23 |
申請(qǐng)公布號(hào) | CN112395852A | 申請(qǐng)公布日 | 2021-02-23 |
分類號(hào) | G06F40/194(2020.01)I;G06F40/106(2020.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 章杰;劉紹軍 | 申請(qǐng)(專利權(quán))人 | 江西金格科技有限公司 |
代理機(jī)構(gòu) | - | 代理人 | - |
地址 | 330096江西省南昌市高新區(qū)火炬大街579號(hào)綠悅科技大廈15樓 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種多文件格式版式文檔的對(duì)比方法,文檔元素提取環(huán)節(jié)是依據(jù)不同版式文檔格式的標(biāo)準(zhǔn)作為參考,對(duì)標(biāo)準(zhǔn)版式文檔的格式解析與內(nèi)容讀取,并將最終解析出來的數(shù)據(jù)內(nèi)容作為文檔元素抽象環(huán)節(jié)的輸入數(shù)據(jù);按上述輸入數(shù)據(jù)將文檔中的主要圖元元素抽象轉(zhuǎn)換為自定義的文檔圖元結(jié)構(gòu),并將抽象后的文檔圖元結(jié)構(gòu)數(shù)據(jù)以不同后綴類型的文件分類保存;文檔內(nèi)容對(duì)比環(huán)節(jié)按照文件后綴名分類,逐類型地進(jìn)行圖元抽象文件的讀取與對(duì)比操作,且將對(duì)比結(jié)果作為文檔差異輸出環(huán)節(jié)的輸入數(shù)據(jù),對(duì)差異結(jié)果進(jìn)行匯總、合并與展示。提供了一個(gè)彈性的質(zhì)量效果衡量工具,解決了當(dāng)前人工檢測(cè)文檔轉(zhuǎn)換質(zhì)量所存在的檢測(cè)效率與準(zhǔn)確性低下的弊端。?? |
