一種運(yùn)營(yíng)商網(wǎng)關(guān)數(shù)據(jù)的預(yù)處理方法及系統(tǒng)

基本信息

申請(qǐng)?zhí)?/td> CN201710245857.3 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN107590169B 公開(kāi)(公告)日 2020-03-06
申請(qǐng)公布號(hào) CN107590169B 申請(qǐng)公布日 2020-03-06
分類號(hào) G06F16/25;G06F16/903;H04L29/08 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 駱宗偉;韓帥;李斌;劉金群;王博仁;陳圣鐸;周興友;楊謙 申請(qǐng)(專利權(quán))人 深圳市傲天科技股份有限公司
代理機(jī)構(gòu) 深圳中一專利商標(biāo)事務(wù)所 代理人 南方科技大學(xué);深圳市傲天科技股份有限公司
地址 518055 廣東省深圳市南山區(qū)西麗學(xué)苑大道1088號(hào)
法律狀態(tài) -

摘要

摘要 本發(fā)明屬于數(shù)據(jù)處理技術(shù)領(lǐng)域,提出一種運(yùn)營(yíng)商網(wǎng)關(guān)數(shù)據(jù)的預(yù)處理方法及系統(tǒng)。所述預(yù)處理方法包括:獲取運(yùn)營(yíng)商網(wǎng)關(guān)的日志數(shù)據(jù);根據(jù)預(yù)設(shè)的過(guò)濾規(guī)則對(duì)所述日志數(shù)據(jù)進(jìn)行過(guò)濾;利用正則表達(dá)式從過(guò)濾后的日志數(shù)據(jù)中提取出包含用戶搜索關(guān)鍵詞字段的目標(biāo)數(shù)據(jù)集;對(duì)所述目標(biāo)數(shù)據(jù)集進(jìn)行結(jié)構(gòu)化處理,得到結(jié)構(gòu)化的目標(biāo)數(shù)據(jù)集;將所述結(jié)構(gòu)化的目標(biāo)數(shù)據(jù)集中的關(guān)鍵詞字段與預(yù)設(shè)的目標(biāo)字符串進(jìn)行匹配,根據(jù)匹配結(jié)果以及所述目標(biāo)數(shù)據(jù)集對(duì)應(yīng)的用戶信息確定所述目標(biāo)字符串對(duì)應(yīng)的目標(biāo)用戶,所述用戶信息為所述目標(biāo)數(shù)據(jù)集中用于確定用戶身份的信息。與傳統(tǒng)的數(shù)據(jù)預(yù)處理方法相比,本發(fā)明提出的數(shù)據(jù)預(yù)處理方法對(duì)運(yùn)營(yíng)商網(wǎng)關(guān)服務(wù)器的日志數(shù)據(jù)的處理效果獲得大幅提升。