一種提升Impala查詢?nèi)萘康膶崿F(xiàn)方案

基本信息

申請?zhí)?/td> CN202010064306.9 申請日 -
公開(公告)號 CN113138976A 公開(公告)日 2021-07-20
申請公布號 CN113138976A 申請公布日 2021-07-20
分類號 G06F16/215(2019.01)I;G06F16/22(2019.01)I;G06F16/2455(2019.01)I;G06F16/27(2019.01)I 分類 計算;推算;計數(shù);
發(fā)明人 王東;張晨飛 申請(專利權)人 南京中新賽克科技有限責任公司
代理機構(gòu) 南京蘇高專利商標事務所(普通合伙) 代理人 柏尚春
地址 210012江蘇省南京市雨花臺區(qū)寧雙路19號2幢1501室
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種提升Impala查詢?nèi)萘康膶崿F(xiàn)方案,將從數(shù)據(jù)源收集,處理后的數(shù)據(jù)存儲到Hadoop集群中,Impala關聯(lián)Hadoop集群,通過將元數(shù)據(jù)緩存入Redis中,在用戶首次提交查詢請求,SQL引擎創(chuàng)建執(zhí)行計劃時,從Redis中獲取元數(shù)據(jù),反序列化后存入Lrucache中,后續(xù)請求創(chuàng)建執(zhí)行計劃直接從Lrucache中獲取元數(shù)據(jù),該方案可以支持元數(shù)據(jù)大于4G的表的更新,從而支持元數(shù)據(jù)大于4G的大表的查詢。