SparkSQL多表連接優(yōu)化方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
基本信息
申請?zhí)?/td> | CN202110570663.7 | 申請日 | - |
公開(公告)號 | CN113407532A | 公開(公告)日 | 2021-09-17 |
申請公布號 | CN113407532A | 申請公布日 | 2021-09-17 |
分類號 | G06F16/22(2019.01)I;G06F16/242(2019.01)I;G06F16/2453(2019.01)I;G06F16/28(2019.01)I;G06K9/62(2006.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 宋愛波;付豪;方效林;楊明 | 申請(專利權(quán))人 | 南京逸智網(wǎng)絡(luò)空間技術(shù)創(chuàng)新研究院有限公司 |
代理機(jī)構(gòu) | 南京經(jīng)緯專利商標(biāo)代理有限公司 | 代理人 | 羅運(yùn)紅 |
地址 | 210012江蘇省南京市雨花臺(tái)區(qū)大周路34號科創(chuàng)城B3棟第8層及第7層702、703室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本申請涉及一種Spark SQL多表連接優(yōu)化方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)。該方法包括:獲取根據(jù)目標(biāo)數(shù)據(jù)倉庫設(shè)計(jì)的SQL多表連接查詢語句集;將SQL多表連接查詢語句集劃分為訓(xùn)練集和測試集;根據(jù)訓(xùn)練集和測試集,對預(yù)先構(gòu)建的馬爾可夫決策模型進(jìn)行訓(xùn)練,獲得目標(biāo)數(shù)據(jù)倉庫的多表連接查詢計(jì)劃選擇策略;根據(jù)多表連接查詢計(jì)劃選擇策略,對目標(biāo)數(shù)據(jù)倉庫的數(shù)據(jù)表進(jìn)行連接。解決了Spark SQL現(xiàn)有的查詢優(yōu)化在多表連接查詢計(jì)劃選擇時(shí)效率低、依賴開發(fā)人員經(jīng)驗(yàn)的問題,能夠快速有效地構(gòu)建多表連接查詢執(zhí)行計(jì)劃,從而提高Spark SQL執(zhí)行效率。 |
