一種IndexR實時數(shù)據(jù)分析庫

基本信息

申請?zhí)?/td> CN201710355812.1 申請日 -
公開(公告)號 CN107133342A 公開(公告)日 2017-09-05
申請公布號 CN107133342A 申請公布日 2017-09-05
分類號 G06F17/30(2006.01)I;G06Q30/02(2012.01)I 分類 計算;推算;計數(shù);
發(fā)明人 李華煜;韋萬 申請(專利權)人 廣州舜飛信息科技有限公司
代理機構 北京華仲龍騰專利代理事務所(普通合伙) 代理人 廣州舜飛信息科技有限公司
地址 510000 廣東省廣州市天河區(qū)棠東東路5號商業(yè)(部位:B-425)
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種IndexR實時數(shù)據(jù)分析庫;IndexR實時數(shù)據(jù)分析庫實現(xiàn)了一種可部署于分布式環(huán)境,可并行化處理,帶索引的,列式的結(jié)構化數(shù)據(jù)格式?;谶@種數(shù)據(jù)格式,IndexR構建了一個數(shù)據(jù)倉庫系統(tǒng)(Data?Warehouse),基于Hadoop生態(tài),可以對海量數(shù)據(jù)集做快速統(tǒng)計分析(OLAP),數(shù)據(jù)可實時導入并且對于查詢零延遲。IndexR為解決大數(shù)據(jù)場景下分析緩慢、數(shù)據(jù)延遲、系統(tǒng)復雜等問題而設計。本發(fā)明的IndexR實時數(shù)據(jù)分析庫把數(shù)據(jù)存放于HDFS,使用Zookeeper在集群中通訊和交涉,使用Hive方便的管理分區(qū)數(shù)據(jù),可以通過Kafka高速實時導入數(shù)據(jù),查詢層使用優(yōu)秀的分布式查詢引擎Apache?Drill。