一種基于Hive的高校數(shù)據(jù)倉(cāng)庫(kù)分層設(shè)計(jì)方法

基本信息

申請(qǐng)?zhí)?/td> CN201811098136.5 申請(qǐng)日 -
公開(公告)號(hào) CN109189764A 公開(公告)日 2019-01-11
申請(qǐng)公布號(hào) CN109189764A 申請(qǐng)公布日 2019-01-11
分類號(hào) G06F16/21;G06F16/28 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 楊連群 申請(qǐng)(專利權(quán))人 北京桃花島信息技術(shù)有限公司
代理機(jī)構(gòu) 合肥中谷知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 洪玲
地址 100089 北京市海淀區(qū)玲瓏路9號(hào)院東區(qū)8號(hào)樓12層1218
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及一種基于Hive的高校數(shù)據(jù)倉(cāng)庫(kù)分層設(shè)計(jì)方法,包括:獲取數(shù)據(jù),使用ETL工具進(jìn)行數(shù)據(jù)抽取,將獲取的結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù)同步到Hive平臺(tái)上;使用Hive構(gòu)建數(shù)據(jù)倉(cāng)庫(kù),將數(shù)據(jù)倉(cāng)庫(kù)分為ODS數(shù)據(jù)存儲(chǔ)層、DWD數(shù)據(jù)明細(xì)層、DW數(shù)據(jù)匯總層、DWA數(shù)據(jù)應(yīng)用層;數(shù)據(jù)倉(cāng)庫(kù)建模,確定分析主題,使用維度建模法,使用最小粒度設(shè)計(jì)維表,設(shè)計(jì)事實(shí)表;設(shè)計(jì)事實(shí)表,分為事實(shí)表?非分區(qū)表,和分區(qū)事實(shí)表。本發(fā)明提出的數(shù)據(jù)倉(cāng)庫(kù)分層設(shè)計(jì)相比其他大數(shù)據(jù)倉(cāng)庫(kù)設(shè)計(jì)三層分析處理更靈活,可擴(kuò)展性強(qiáng),后期可根據(jù)業(yè)務(wù)需求增加相應(yīng)的分析主題,將Hive大數(shù)據(jù)平臺(tái)優(yōu)點(diǎn)和數(shù)據(jù)倉(cāng)庫(kù)星型模型設(shè)計(jì)方法高效地結(jié)合起來。