一種基于SparkStreaming的動態(tài)更新共享數據方法

基本信息

申請?zhí)?/td> CN202110043173.1 申請日 -
公開(公告)號 CN112559227A 公開(公告)日 2021-03-26
申請公布號 CN112559227A 申請公布日 2021-03-26
分類號 G06F16/2455(2019.01)I;G06F9/54(2006.01)I;G06F8/656(2018.01)I 分類 計算;推算;計數;
發(fā)明人 齊博 申請(專利權)人 貴州省廣播電視信息網絡股份有限公司
代理機構 貴州啟辰知識產權代理有限公司 代理人 趙彥棟;葛歆瑋
地址 550081貴州省貴陽市觀山湖區(qū)金陽南路36號
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種基于Spark Streaming的動態(tài)更新共享數據方法,就Spark而言,大變量都會由Driver端來進行分發(fā),這個大變量如果不是廣播變量,那每一個task就會分發(fā)一份出來,這在task數目在十分多的情況下Driver端的帶寬就會成為系統瓶頸,而且還會大量消耗task服務器的資源,我們如果將這個變量聲明為廣播變量,那么每個executor都會擁有一份,這個executor啟動的task會共享變量,節(jié)省了通信的成本和服務器的資源。而在更需要資源的Spark Streaming中,廣播變量無非是將大變量傳遞給executor端最好的選擇,但是流式程序啟動之后無法在進行更新廣播變量,優(yōu)勢在于,不需要重啟程序則完成動態(tài)的更新,解決生產線上需要重啟的弊端。??