一種基于spark的大數(shù)據(jù)處理方法
基本信息
申請(qǐng)?zhí)?/td> | CN202010063433.7 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN113139003A | 公開(公告)日 | 2021-07-20 |
申請(qǐng)公布號(hào) | CN113139003A | 申請(qǐng)公布日 | 2021-07-20 |
分類號(hào) | G06F16/2455(2019.01)I;G06F16/2458(2019.01)I;G06F16/27(2019.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 李方進(jìn) | 申請(qǐng)(專利權(quán))人 | 上海靜客網(wǎng)絡(luò)科技有限公司 |
代理機(jī)構(gòu) | 北京挺立專利事務(wù)所(普通合伙) | 代理人 | 田黎絨 |
地址 | 201913上海市崇明區(qū)長(zhǎng)興鎮(zhèn)鳳濱路258號(hào)潤(rùn)豐農(nóng)貿(mào)市場(chǎng)東門16號(hào)房 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種基于spark的大數(shù)據(jù)處理方法,包括將數(shù)據(jù)處理結(jié)果需要進(jìn)行比對(duì)的兩方數(shù)據(jù)同時(shí)緩存至中間庫,所述兩方數(shù)據(jù)包括第一方數(shù)據(jù)和第二方數(shù)據(jù);根據(jù)第一方數(shù)據(jù)的數(shù)量分配多個(gè)處理第一方數(shù)據(jù)的第一副線程,根據(jù)第二方數(shù)據(jù)的數(shù)量分配多個(gè)處理第二方數(shù)據(jù)的第二副線程;多個(gè)第一副線程均完成數(shù)據(jù)處理時(shí),觸發(fā):第一主線程對(duì)所有副線程的數(shù)據(jù)處理結(jié)果進(jìn)行收集,并生成第一方數(shù)據(jù)的處理結(jié)果;多個(gè)第二副線程均完成數(shù)據(jù)處理時(shí),觸發(fā):第二主線程對(duì)所有副線程的數(shù)據(jù)處理結(jié)果進(jìn)行收集,并生成第二方數(shù)據(jù)的處理結(jié)果;將第一方數(shù)據(jù)的處理結(jié)果和第二方數(shù)據(jù)的處理結(jié)果同時(shí)輸出。解決了在企業(yè)對(duì)賬中,不能輸出對(duì)賬結(jié)果的問題。 |
