超大數(shù)據(jù)集的合并方法及裝置

基本信息

申請(qǐng)?zhí)?/td> CN201810772324.5 申請(qǐng)日 -
公開(公告)號(hào) CN109033295B 公開(公告)日 2021-07-02
申請(qǐng)公布號(hào) CN109033295B 申請(qǐng)公布日 2021-07-02
分類號(hào) G06F16/25;G06F16/2455 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 史貴振;高福海;張瑩瑩 申請(qǐng)(專利權(quán))人 成都亞信網(wǎng)絡(luò)安全產(chǎn)業(yè)技術(shù)研究院有限公司
代理機(jī)構(gòu) 北京中博世達(dá)專利商標(biāo)代理有限公司 代理人 申健
地址 610213 四川省成都市天府新區(qū)華陽(yáng)街道天府大道南段846號(hào)
法律狀態(tài) -

摘要

摘要 本發(fā)明提供了一種超大數(shù)據(jù)集的合并方法及裝置,涉及數(shù)據(jù)處理技術(shù)領(lǐng)域,用于解決現(xiàn)有技術(shù)中超大數(shù)據(jù)集的合并效率偏低的問題。本發(fā)明提供的方法及裝置基于分布式計(jì)算實(shí)現(xiàn),包括:將第一數(shù)據(jù)集的第一關(guān)聯(lián)主鍵轉(zhuǎn)換為預(yù)設(shè)字段類型的數(shù)據(jù)后根據(jù)第一關(guān)聯(lián)主鍵對(duì)第一數(shù)據(jù)集進(jìn)行分片,獲取預(yù)設(shè)數(shù)量的第一數(shù)據(jù)分片并將其緩存至預(yù)設(shè)緩存系統(tǒng);將第二數(shù)據(jù)集的第二關(guān)聯(lián)主鍵轉(zhuǎn)換為預(yù)設(shè)字段類型的數(shù)據(jù)后根據(jù)第二關(guān)聯(lián)主鍵對(duì)第二數(shù)據(jù)集進(jìn)行分片,獲取預(yù)設(shè)數(shù)量的第二數(shù)據(jù)分片;從預(yù)設(shè)緩存系統(tǒng)中讀取第一數(shù)據(jù)分片,對(duì)第一數(shù)據(jù)分片和第二數(shù)據(jù)分片進(jìn)行匹配,并將匹配后的第一數(shù)據(jù)分片和第二數(shù)據(jù)分片進(jìn)行合并。本發(fā)明能夠用于對(duì)超大數(shù)據(jù)集進(jìn)行合并。