一種基于“用歸并算法計算一對一join、一對多join”的對位分段并行方法
基本信息
申請?zhí)?/td> | CN201710950911.4 | 申請日 | - |
公開(公告)號 | CN107657050A | 公開(公告)日 | 2018-02-02 |
申請公布號 | CN107657050A | 申請公布日 | 2018-02-02 |
分類號 | G06F17/30 | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 蔣步星 | 申請(專利權(quán))人 | 北京潤乾信息系統(tǒng)技術(shù)有限公司 |
代理機(jī)構(gòu) | - | 代理人 | - |
地址 | 100085 北京市海淀區(qū)上地四街8號華成大廈501 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明提供了一種基于“用歸并算法計算一對一join、一對多join”的對位分段并行方法。把數(shù)據(jù)集A平均分成N段,分完段以后把每段的第一條記錄的主鍵鍵值讀出來,與數(shù)據(jù)集A對應(yīng)的數(shù)據(jù)集B也得分段,根據(jù)數(shù)據(jù)集A中每段的第一條記錄的主鍵鍵值用二分法找到數(shù)據(jù)集B中對應(yīng)的每段第一條記錄的關(guān)聯(lián)鍵鍵值。找到數(shù)據(jù)集B中的每一段的起始點(diǎn)以后,對數(shù)據(jù)集B按起始點(diǎn)進(jìn)行分段;每個線程分別單獨(dú)用歸并算法計算一對一join同維數(shù)據(jù)集A和B分的每一個對應(yīng)關(guān)聯(lián)的段,數(shù)據(jù)集A和B分的段在計算時只需要各自遍歷一次,計算完以后的合并數(shù)據(jù)集為C,最后再把這些分段計算后的合并數(shù)據(jù)集C組成最終的數(shù)據(jù)集D,然后就可以在數(shù)據(jù)集D中引用需要的記錄了。 |
