基于大數(shù)據(jù)的信息數(shù)據(jù)存儲整合系統(tǒng)及方法

基本信息

申請?zhí)?/td> CN202011008763.2 申請日 -
公開(公告)號 CN112100469A 公開(公告)日 2020-12-18
申請公布號 CN112100469A 申請公布日 2020-12-18
分類號 G06F16/93;G06F40/194 分類 計算;推算;計數(shù);
發(fā)明人 潘倩雯 申請(專利權(quán))人 云寶寶大數(shù)據(jù)產(chǎn)業(yè)發(fā)展有限責(zé)任公司
代理機構(gòu) 北京華際知識產(chǎn)權(quán)代理有限公司 代理人 黃永蘭
地址 215000 江蘇省蘇州市高新區(qū)鴻禧路471號
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種基于大數(shù)據(jù)的信息數(shù)據(jù)存儲整合系統(tǒng)及方法,所述整合系統(tǒng)包括文檔信息獲取模塊、文檔選取模塊和拆分合并處理模塊,所述文檔信息獲取模塊用于獲取上一個周期內(nèi)待處理文件夾中各個待合并文檔的文檔信息,所述文檔信息包括文檔名稱和最后修改時間,所述文檔選取模塊從待合并文檔中選出疑似相近文檔,再從疑似相近文檔中篩選出相近文檔,所述拆分合并處理模塊對相近文檔進行拆分合并處理。