一種大批量數(shù)據(jù)的預(yù)處理及入庫的方法

基本信息

申請?zhí)?/td> CN201910794841.7 申請日 -
公開(公告)號 CN110489403A 公開(公告)日 2019-11-22
申請公布號 CN110489403A 申請公布日 2019-11-22
分類號 G06F16/21(2019.01); G06F16/25(2019.01) 分類 計算;推算;計數(shù);
發(fā)明人 趙偉; 康磊 申請(專利權(quán))人 江蘇華庫數(shù)據(jù)技術(shù)有限公司
代理機(jī)構(gòu) - 代理人 -
地址 210000 江蘇省南京市建鄴區(qū)奧體大街69號1幢20層
法律狀態(tài) -

摘要

摘要 一種大批量數(shù)據(jù)的預(yù)處理及入庫的方法,具體方法包括以下步驟:步驟一、第一個過程是數(shù)據(jù)預(yù)處理的過程,該過程的輸入是待加載的源數(shù)據(jù)文件,輸出是可以直接給第二個過程使用的集群存儲層數(shù)據(jù)文件;步驟二、第二個過程是數(shù)據(jù)提交過程,即將預(yù)處理過程的輸出提交到集群數(shù)據(jù)庫系統(tǒng)中。本方法中加載的數(shù)據(jù)預(yù)處理過程不需要持有加載表的寫鎖,可以與加載表的其它DML并發(fā)進(jìn)行;數(shù)據(jù)預(yù)處理過程相對獨(dú)立,可以將數(shù)據(jù)預(yù)處理過程放置到集群資源比較空閑的節(jié)點(diǎn)上,實(shí)現(xiàn)負(fù)載均衡。