一種基于HIVE的數(shù)據(jù)增量采集方法

基本信息

申請?zhí)?/td> CN202210368943.4 申請日 -
公開(公告)號 CN114647641A 公開(公告)日 2022-06-21
申請公布號 CN114647641A 申請公布日 2022-06-21
分類號 G06F16/215(2019.01)I;G06F16/22(2019.01)I;G06F16/23(2019.01)I;G06F16/2458(2019.01)I 分類 計算;推算;計數(shù);
發(fā)明人 鄭士良;劉威憲;黎榮華;安寶;劉東東;林楠;陳文豪;張夏楠 申請(專利權(quán))人 河鋼數(shù)字技術(shù)股份有限公司
代理機構(gòu) 石家莊知住優(yōu)創(chuàng)知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 -
地址 050000河北省石家莊市高新區(qū)黃河大道136號科技中心1號樓
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種基于HIVE的數(shù)據(jù)增量采集方法,涉及大數(shù)據(jù)采集與數(shù)據(jù)清洗治理技術(shù)領(lǐng)域。該基于HIVE的數(shù)據(jù)增量采集方法在使用時,只需要配置相關(guān)的采集任務(wù)和sql腳本任務(wù),將sql腳本放入可執(zhí)行帶參數(shù)sql腳本的sql執(zhí)行工具中,只暴露出表名,創(chuàng)建時間,更新時間,主鍵,原表可能會刪除數(shù)據(jù)的時間段n,用戶只需填入這幾個關(guān)鍵信息進行sql執(zhí)行任務(wù)配置,即可統(tǒng)一解決以上問題,保證數(shù)據(jù)的一致性;sql腳本處理流程復(fù)用性強,形式靈活,操作簡單,將sql腳本放入執(zhí)行工具,只需填入相關(guān)參數(shù),即可進行各類治理,適用于hive庫內(nèi)所有類型的表及表內(nèi)不同格式的時間字段的情況。