一種流處理方式支持動態(tài)讀取hive表數據的方法及裝置
基本信息
申請?zhí)?/td> | CN202111194393.0 | 申請日 | - |
公開(公告)號 | CN113886330A | 公開(公告)日 | 2022-01-04 |
申請公布號 | CN113886330A | 申請公布日 | 2022-01-04 |
分類號 | G06F16/13(2019.01)I;G06F16/16(2019.01)I;G06F16/182(2019.01)I | 分類 | 計算;推算;計數; |
發(fā)明人 | 趙方楊;高東升;梅綱 | 申請(專利權)人 | 武漢達夢數據庫股份有限公司 |
代理機構 | 深圳市六加知識產權代理有限公司 | 代理人 | 向彬 |
地址 | 430000湖北省武漢市東湖新技術開發(fā)區(qū)高新大道999號未來科技大廈C3棟16-19層 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明涉及計算機技術領域,提供了一種流處理方式支持動態(tài)讀取hive表數據的方法及裝置,方法包括:設置patitionMap和partitionValueList,設置第一輪讀取中的時間戳為預設初始值;若patitionMap中能夠找到partitionValueList中待讀取的分區(qū)名,則判定相應待讀取的分區(qū)為老分區(qū);若老分區(qū)中待讀取文件的文件修改時間大于patitionMap中相應分區(qū)中已經讀取過的最大的文件修改時間,且老分區(qū)中待讀取文件的文件修改時間大于當前輪時間戳,則判定老分區(qū)中待讀取文件為老分區(qū)新文件,按partitionValueList中相應待讀取文件的路徑進行老分區(qū)新文件的讀?。槐景l(fā)明提供的流處理方式支持動態(tài)讀取hive表數據的方法可以在流機制上執(zhí)行hive的數據源,使流處理引擎能夠對hive中的老分區(qū)新文件進行動態(tài)讀取。 |
