基于Hadoop大數(shù)據(jù)處理技術(shù)的日志分析系統(tǒng)

基本信息

申請(qǐng)?zhí)?/td> CN201610006805.6 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN105677842A 公開(kāi)(公告)日 2016-06-15
申請(qǐng)公布號(hào) CN105677842A 申請(qǐng)公布日 2016-06-15
分類號(hào) G06F17/30(2006.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 許丹霞;劉寅;汪偉;鄭宇 申請(qǐng)(專利權(quán))人 北京匯商融通信息技術(shù)有限公司
代理機(jī)構(gòu) 北京迎碩知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 呂良;張群峰
地址 100028 北京市大興區(qū)經(jīng)濟(jì)開(kāi)發(fā)區(qū)科苑路18號(hào)華商創(chuàng)意4號(hào)樓
法律狀態(tài) -

摘要

摘要 本發(fā)明公開(kāi)了一種基于Hadoop平臺(tái)開(kāi)發(fā)的企業(yè)網(wǎng)站日志分析系統(tǒng),主要分為五個(gè)模塊,分別是文件上傳模塊、數(shù)據(jù)清洗模塊、數(shù)據(jù)統(tǒng)計(jì)分析模塊、數(shù)據(jù)導(dǎo)出模塊、數(shù)據(jù)展現(xiàn)模塊??梢杂?jì)算得到網(wǎng)站各大關(guān)鍵指標(biāo),包括瀏覽量PV、注冊(cè)用戶數(shù)、ip數(shù)、跳出率,數(shù)據(jù)的展現(xiàn)可以實(shí)現(xiàn)海量數(shù)據(jù)的毫秒級(jí)查詢。