基于數(shù)據(jù)湖的異構(gòu)數(shù)據(jù)源集成方法及裝置

基本信息

申請(qǐng)?zhí)?/td> CN202010809326.4 申請(qǐng)日 -
公開(公告)號(hào) CN111966750A 公開(公告)日 2020-11-20
申請(qǐng)公布號(hào) CN111966750A 申請(qǐng)公布日 2020-11-20
分類號(hào) G06F16/27;G06F16/25 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 翟士丹 申請(qǐng)(專利權(quán))人 北京海致科技集團(tuán)有限公司
代理機(jī)構(gòu) - 代理人 -
地址 100083 北京市海淀區(qū)學(xué)院路甲5號(hào)2幢平房B-1011
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了基于數(shù)據(jù)湖的異構(gòu)數(shù)據(jù)源集成方法及裝置,其方法包括如下步驟:a、根據(jù)用戶調(diào)用寫數(shù)據(jù)接口的信息,確定本次寫請(qǐng)求的操作標(biāo)示、數(shù)據(jù)、時(shí)間戳,其中操作標(biāo)示包含追加、更新、刪除三種類型,時(shí)間戳為寫請(qǐng)求達(dá)到的時(shí)間,將以上信息追加寫入到數(shù)據(jù)湖中的一個(gè)特定文件內(nèi);b、將上一步寫入到特定文件內(nèi)的數(shù)據(jù),結(jié)合操作標(biāo)示及時(shí)間戳做數(shù)據(jù)合并處理,得到最終的結(jié)果數(shù)據(jù)。本發(fā)明解決了現(xiàn)有數(shù)據(jù)湖數(shù)據(jù)集成技術(shù),無(wú)法支持?jǐn)?shù)據(jù)更新操作,不能將數(shù)據(jù)湖的數(shù)據(jù)和原始數(shù)據(jù)保持一致,不能有效解決大數(shù)據(jù)集群大量小文件導(dǎo)致查詢性能低效等問(wèn)題。