Hadoop多管道數(shù)據(jù)處理分析方法
基本信息
申請(qǐng)?zhí)?/td> | CN201811174507.3 | 申請(qǐng)日 | - |
公開(kāi)(公告)號(hào) | CN109299057A | 公開(kāi)(公告)日 | 2019-02-01 |
申請(qǐng)公布號(hào) | CN109299057A | 申請(qǐng)公布日 | 2019-02-01 |
分類號(hào) | G06F16/182;G06F16/18;G06F16/16 | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 林森;唐寧;馬娜 | 申請(qǐng)(專利權(quán))人 | 北京快友世紀(jì)科技股份有限公司 |
代理機(jī)構(gòu) | - | 代理人 | - |
地址 | 100020 北京市朝陽(yáng)區(qū)東三環(huán)北路甲2號(hào)7幢315室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開(kāi)了一種Hadoop多管道數(shù)據(jù)處理分析方法,該方法利用Hadoop分布式文件系統(tǒng)來(lái)處理海量數(shù)據(jù),系統(tǒng)包括用戶節(jié)點(diǎn)、命名節(jié)點(diǎn)、塊掃描模塊和云端節(jié)點(diǎn),用戶節(jié)點(diǎn)包括JAVA虛擬機(jī),JAVA虛擬機(jī)包括Hadoop用戶端;云端節(jié)點(diǎn)包括數(shù)據(jù)節(jié)點(diǎn);Hadoop用戶端向命名節(jié)點(diǎn)發(fā)送具有參數(shù)的打開(kāi)命令;命名節(jié)點(diǎn)使用定位塊數(shù)據(jù)結(jié)構(gòu)響應(yīng)Hadoop用戶端;Hadoop用戶端通過(guò)為每個(gè)請(qǐng)求的塊發(fā)送包含所請(qǐng)求塊的塊ID,從所識(shí)別的數(shù)據(jù)節(jié)點(diǎn)直接請(qǐng)求文件的塊;接收請(qǐng)求的數(shù)據(jù)節(jié)點(diǎn)使用所請(qǐng)求塊的塊ID來(lái)訪問(wèn)它正在存儲(chǔ)的相應(yīng)塊之一,并用所訪問(wèn)塊的數(shù)據(jù)響應(yīng)Hadoop用戶端;Hadoop用戶端向命名節(jié)點(diǎn)指示想要將數(shù)據(jù)塊附加到現(xiàn)有文件;命名節(jié)點(diǎn)接收Hadoop用戶端發(fā)送的附加命令。 |
