基于大數(shù)據(jù)的信息數(shù)據(jù)存儲整合系統(tǒng)及方法
基本信息
申請?zhí)?/td> | CN202011008763.2 | 申請日 | - |
公開(公告)號 | CN112100469A | 公開(公告)日 | 2020-12-18 |
申請公布號 | CN112100469A | 申請公布日 | 2020-12-18 |
分類號 | G06F16/93;G06F40/194 | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 潘倩雯 | 申請(專利權(quán))人 | 云寶寶大數(shù)據(jù)產(chǎn)業(yè)發(fā)展有限責(zé)任公司 |
代理機構(gòu) | 北京華際知識產(chǎn)權(quán)代理有限公司 | 代理人 | 黃永蘭 |
地址 | 215000 江蘇省蘇州市高新區(qū)鴻禧路471號 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種基于大數(shù)據(jù)的信息數(shù)據(jù)存儲整合系統(tǒng)及方法,所述整合系統(tǒng)包括文檔信息獲取模塊、文檔選取模塊和拆分合并處理模塊,所述文檔信息獲取模塊用于獲取上一個周期內(nèi)待處理文件夾中各個待合并文檔的文檔信息,所述文檔信息包括文檔名稱和最后修改時間,所述文檔選取模塊從待合并文檔中選出疑似相近文檔,再從疑似相近文檔中篩選出相近文檔,所述拆分合并處理模塊對相近文檔進行拆分合并處理。 |
