基于大數(shù)據(jù)的信息數(shù)據(jù)存儲整合系統(tǒng)及方法

基本信息

申請?zhí)?/td> CN202011008763.2 申請日 -
公開(公告)號 CN112100469B 公開(公告)日 2021-07-27
申請公布號 CN112100469B 申請公布日 2021-07-27
分類號 G06F16/93(2019.01)I;G06F40/194(2020.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 周勃;劉紅霖;黃瀛;潘倩雯 申請(專利權(quán))人 云寶寶大數(shù)據(jù)產(chǎn)業(yè)發(fā)展有限責(zé)任公司
代理機(jī)構(gòu) 南寧東之智專利代理有限公司 代理人 嚴(yán)涓逢
地址 530000廣西壯族自治區(qū)南寧市中國(廣西)自由貿(mào)易試驗(yàn)區(qū)南寧片區(qū)云英路8號五象總部大廈3號樓1909號房
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種基于大數(shù)據(jù)的信息數(shù)據(jù)存儲整合系統(tǒng)及方法,所述整合系統(tǒng)包括文檔信息獲取模塊、文檔選取模塊和拆分合并處理模塊,所述文檔信息獲取模塊用于獲取上一個(gè)周期內(nèi)待處理文件夾中各個(gè)待合并文檔的文檔信息,所述文檔信息包括文檔名稱和最后修改時(shí)間,所述文檔選取模塊從待合并文檔中選出疑似相近文檔,再從疑似相近文檔中篩選出相近文檔,所述拆分合并處理模塊對相近文檔進(jìn)行拆分合并處理。