基于網(wǎng)絡(luò)爬蟲行為識別與緩沖更新策略的Web點擊計數(shù)方法
基本信息
申請?zhí)?/td> | CN201310567276.3 | 申請日 | - |
公開(公告)號 | CN103678492B | 公開(公告)日 | 2018-01-19 |
申請公布號 | CN103678492B | 申請公布日 | 2018-01-19 |
分類號 | G06F17/30;G06F9/44 | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 曾劍平;羅邦慧 | 申請(專利權(quán))人 | 深圳前海財信云科技有限公司 |
代理機構(gòu) | 上海正旦專利代理有限公司 | 代理人 | 復(fù)旦大學(xué);深圳前海財信云科技有限公司 |
地址 | 200433 上海市楊浦區(qū)邯鄲路220號 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明屬于Web設(shè)計技術(shù)領(lǐng)域,具體為一種基于網(wǎng)絡(luò)爬蟲行為識別與緩沖更新策略的Web點擊計數(shù)方法。本方法首先建立Web站點的頁面組織結(jié)構(gòu)的邏輯表示,綜合運用客戶端身份識別、Web頁面邏輯結(jié)構(gòu)匹配和時間屬性進行爬蟲行為識別,然后在設(shè)定緩沖計數(shù)結(jié)構(gòu)的基礎(chǔ)上,基于識別結(jié)果進行點擊計數(shù)的更新。本方法能夠正確識別爬蟲點擊行為,避免計數(shù)出現(xiàn)虛高現(xiàn)象,同時又能及時地進行Web真實點擊計數(shù)的更新,本方法適用于各種需要進行鏈接或頁面點擊計數(shù)的應(yīng)用場合。 |
