網(wǎng)頁(yè)數(shù)據(jù)分析處理方法及裝置
基本信息
申請(qǐng)?zhí)?/td> | CN201811084330.8 | 申請(qǐng)日 | - |
公開(kāi)(公告)號(hào) | CN109408745A | 公開(kāi)(公告)日 | 2019-03-01 |
申請(qǐng)公布號(hào) | CN109408745A | 申請(qǐng)公布日 | 2019-03-01 |
分類(lèi)號(hào) | G06F16/955 | 分類(lèi) | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 曹?chē)?yán)清;王慧生 | 申請(qǐng)(專(zhuān)利權(quán))人 | 國(guó)美供應(yīng)鏈科技有限公司 |
代理機(jī)構(gòu) | 北京市盈科律師事務(wù)所 | 代理人 | 張晶 |
地址 | 100041 北京市石景山區(qū)實(shí)興大街30號(hào)院5號(hào)樓3層15號(hào) | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明實(shí)施例公開(kāi)一種網(wǎng)頁(yè)數(shù)據(jù)分析處理方法及裝置,該方法包括:獲取目標(biāo)網(wǎng)頁(yè)的URL數(shù)據(jù);將所述URL數(shù)據(jù)進(jìn)行拆分,得到二元組集合,二元組集合包括由拆分后的元素信息組成的二元組的集合,其中,一組元素信息對(duì)應(yīng)一個(gè)二元組,二元組包括元素和所述元素的位置信息;根據(jù)二元組對(duì)應(yīng)的元素出現(xiàn)的頻率信息對(duì)URL數(shù)據(jù)進(jìn)行壓縮處理,得到URL的pattern模式。該方法可以將各種Web應(yīng)用訪問(wèn)數(shù)據(jù)中的大量URL數(shù)據(jù),壓縮成少量的pattern模式,保留必要的字符信息,通過(guò)壓縮后少量的pattern模式展現(xiàn),大大減小了數(shù)據(jù)處理量和計(jì)算量,且利用處理后的pattern模式的數(shù)據(jù)能夠直接進(jìn)行人為觀測(cè)與安全分析。 |
