非關(guān)系型數(shù)據(jù)庫HBase的數(shù)據(jù)遷移方法

基本信息

申請(qǐng)?zhí)?/td> CN201310421176.X 申請(qǐng)日 -
公開(公告)號(hào) CN103514274A 公開(公告)日 2014-01-15
申請(qǐng)公布號(hào) CN103514274A 申請(qǐng)公布日 2014-01-15
分類號(hào) G06F17/30(2006.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 貝毅君;唐宏波;王丞淼;王寬 申請(qǐng)(專利權(quán))人 寧波東冠科技有限公司
代理機(jī)構(gòu) 寧波市鄞州甬致專利代理事務(wù)所(普通合伙) 代理人 寧波東冠科技有限公司
地址 315105 浙江省寧波市鄞州區(qū)中河街道孫馬村
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種非關(guān)系型數(shù)據(jù)庫HBase的數(shù)據(jù)遷移方法。本發(fā)明通過讀取用戶的配置文件信息,將用戶指定時(shí)間段內(nèi)的數(shù)據(jù)從舊的HBase集群中遷移到新的HBase集群中,使用該方法具有以下優(yōu)點(diǎn):第一、通過設(shè)計(jì)RowKey,將數(shù)據(jù)的組別信息、時(shí)間信息體現(xiàn)在RowKey上,數(shù)據(jù)遷移時(shí)掃描RowKey,可直接辨別出該RowKey對(duì)應(yīng)的數(shù)據(jù)是否在用戶指定的遷移時(shí)間范圍內(nèi);第二、以組別作為數(shù)據(jù)遷移單位,每個(gè)組別作為一個(gè)檢查點(diǎn),當(dāng)發(fā)生異常情況時(shí),可以將新舊集群之間不同步的數(shù)據(jù)的范圍嚴(yán)格控制在一個(gè)組別內(nèi),減少恢復(fù)數(shù)據(jù)同步所需的時(shí)間;第三、在數(shù)據(jù)遷移過程中記錄日志信息,用于處理數(shù)據(jù)遷移過程中的異常情況,確保新舊集群之間數(shù)據(jù)的同步,能夠準(zhǔn)確、高效的完成HBase集群間的數(shù)據(jù)遷移。