一種提高Spark on yarn實時任務(wù)可靠性的方法

基本信息

申請?zhí)?/td> CN201811393037.X 申請日 -
公開(公告)號 CN109491841A 公開(公告)日 2019-03-19
申請公布號 CN109491841A 申請公布日 2019-03-19
分類號 G06F11/14(2006.01)I; G06F11/30(2006.01)I 分類 計算;推算;計數(shù);
發(fā)明人 馬偉定 申請(專利權(quán))人 南京安訊科技有限責(zé)任公司
代理機構(gòu) 大連至誠專利代理事務(wù)所(特殊普通合伙) 代理人 南京安訊科技有限責(zé)任公司
地址 210012 江蘇省南京市雨花臺區(qū)軟件大道119號5幢201-206室
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種提高Spark on yarn實時任務(wù)可靠性的方法,該方法主要是通過定時輪訓(xùn)Hadoop Yarn任務(wù)池的任務(wù),再通過設(shè)定的模板解析目標(biāo)任務(wù)的狀態(tài),然后根據(jù)解析得到的狀態(tài)判斷是否需要重啟,如果需要重啟則根據(jù)預(yù)置的啟動命令模板拉起任務(wù),必要時進(jìn)行系統(tǒng)日志的記錄和短信等渠道通知。這樣可以有效提高實時任務(wù)的高可用性和系統(tǒng)的健壯性以及任務(wù)相關(guān)的可維護性,提高大數(shù)據(jù)處于過程的健壯性,最終避免任務(wù)因為失敗而等待或者重復(fù)提交,提高大數(shù)據(jù)系統(tǒng)資源(時間和空間)的利用率。該方法可以用于任何基于Hadoop Yarn計算引擎的大數(shù)據(jù)處理應(yīng)用或系統(tǒng)中。