一種基于倒序表的實時日志聚類分析方法

基本信息

申請?zhí)?/td> CN201910880347.2 申請日 -
公開(公告)號 CN110688448A 公開(公告)日 2020-01-14
申請公布號 CN110688448A 申請公布日 2020-01-14
分類號 G06F16/31(2019.01); G06F16/35(2019.01); G06F16/36(2019.01) 分類 計算;推算;計數(shù);
發(fā)明人 楊辰; 葛曉波; 殷傳旺 申請(專利權)人 上海擎創(chuàng)信息技術有限公司
代理機構 北京科億知識產(chǎn)權代理事務所(普通合伙) 代理人 上海擎創(chuàng)信息技術有限公司
地址 201203 上海市浦東新區(qū)申江路5005號星創(chuàng)科技廣場2號樓603室
法律狀態(tài) -

摘要

摘要 本發(fā)明提供一種基于倒序表的實時日志聚類分析方法,具體步驟如下:步驟1:初始化:定義日志中每個詞的封裝結構;步驟2:原始日志預處理,包括正則化替換、敏感詞庫提出、分詞器分詞、詞性標注、公有變量提?。徊襟E3:獲取模板,包括日志分組、倒排表打分、獲取模板、更新模板展示層內(nèi)容以及倒排表。本方法具有實時日志聚類功能,提高模板的通用性,能夠?qū)θ罩具M行并行處理,提高了分析處理的速度。