一種基于作業(yè)調(diào)度系統(tǒng)的應(yīng)用作業(yè)控制系統(tǒng)及其控制方法
基本信息
申請?zhí)?/td> | CN201210333454.1 | 申請日 | - |
公開(公告)號 | CN102880506B | 公開(公告)日 | 2016-09-21 |
申請公布號 | CN102880506B | 申請公布日 | 2016-09-21 |
分類號 | G06F9/46(2006.01)I | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 張磊;張濤 | 申請(專利權(quán))人 | 曙光智算信息技術(shù)有限公司 |
代理機構(gòu) | 北京安博達(dá)知識產(chǎn)權(quán)代理有限公司 | 代理人 | 曙光信息產(chǎn)業(yè)(北京)有限公司 |
地址 | 100193 北京市海淀區(qū)東北旺西路8號中關(guān)村軟件園36號 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明涉及一種基于作業(yè)調(diào)度系統(tǒng)的應(yīng)用作業(yè)控制系統(tǒng)及其控制方法,控制系統(tǒng)包括組播消息發(fā)送器、應(yīng)用程序監(jiān)控器和作業(yè)調(diào)度系統(tǒng);當(dāng)組播消息發(fā)送器被應(yīng)用程序作業(yè)調(diào)用后,向組播域發(fā)送組播消息;應(yīng)用程序監(jiān)控器中的應(yīng)用監(jiān)聽器接收所述組播消息并將其發(fā)送到應(yīng)用程序監(jiān)控器中的消息分析器中;消息分析器判定所述組播消息運行狀態(tài)是否正常,若處于異常狀態(tài),則通過所述作業(yè)調(diào)度系統(tǒng)將該應(yīng)用程序作業(yè)Rerun;該方法解決了現(xiàn)有調(diào)度系統(tǒng)僅從作業(yè)的角度為使用者提供作業(yè)的相應(yīng)狀態(tài)信息,而沒有針對應(yīng)用本身的運行狀態(tài)進(jìn)行監(jiān)控和管理的問題,保證高性能計算集群上作業(yè)內(nèi)的應(yīng)用程序的正常運行,避免了資源的浪費,同時還保證了應(yīng)用程序作業(yè)運行的準(zhǔn)確性。 |
