一種快速在線日志聚類的方法及設備
基本信息
申請?zhí)?/td> | CN202110706311.X | 申請日 | - |
公開(公告)號 | CN113407656A | 公開(公告)日 | 2021-09-17 |
申請公布號 | CN113407656A | 申請公布日 | 2021-09-17 |
分類號 | G06F16/31(2019.01)I;G06F16/33(2019.01)I;G06F16/35(2019.01)I;G06F40/279(2020.01)I | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 王洪濤 | 申請(專利權)人 | 上海上訊信息技術股份有限公司 |
代理機構 | 上海百一領御專利代理事務所(普通合伙) | 代理人 | 王奎宇;楊顏顏 |
地址 | 201203上海市浦東新區(qū)張江高科技園區(qū)郭守敬路498號8幢20300室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本申請的目的是提供一種快速在線日志聚類的方法及設備,本申請通過獲取待分析設備的當前日志數(shù)據(jù);構建日志數(shù)據(jù)的變量識別規(guī)則庫和分隔符識別規(guī)則庫;使用所述變量識別規(guī)則庫對所述當前日志數(shù)據(jù)進行變量分詞處理。得到第一分詞結果,并使用所述分隔符識別規(guī)則庫對所述第一分詞結果進行再次分詞處理,得到目標切分日志數(shù)據(jù),其中,每一條目標切分日志數(shù)據(jù)包含多個成分單詞;基于成分單詞的最大距離窗對所述目標切分日志數(shù)據(jù)進行快速聚類。解決現(xiàn)有技術中在常規(guī)的硬件資源條件下,難以實現(xiàn)高速、實時的日志聚類的問題,以滿足海量數(shù)據(jù)的日志運維需求,加快日志分析數(shù)據(jù)。 |
