基于網(wǎng)絡(luò)爬蟲行為識(shí)別與緩沖更新策略的Web點(diǎn)擊計(jì)數(shù)方法

基本信息

申請(qǐng)?zhí)?/td> CN201310567276.3 申請(qǐng)日 -
公開(公告)號(hào) CN103678492A 公開(公告)日 2014-03-26
申請(qǐng)公布號(hào) CN103678492A 申請(qǐng)公布日 2014-03-26
分類號(hào) G06F17/30(2006.01)I;G06F9/44(2006.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 曾劍平;羅邦慧 申請(qǐng)(專利權(quán))人 深圳前海財(cái)信云科技有限公司
代理機(jī)構(gòu) 上海正旦專利代理有限公司 代理人 陸飛;王潔平
地址 200433 上海市楊浦區(qū)邯鄲路220號(hào)
法律狀態(tài) -

摘要

摘要 本發(fā)明屬于Web設(shè)計(jì)技術(shù)領(lǐng)域,具體為一種基于網(wǎng)絡(luò)爬蟲行為識(shí)別與緩沖更新策略的Web點(diǎn)擊計(jì)數(shù)方法。本方法首先建立Web站點(diǎn)的頁面組織結(jié)構(gòu)的邏輯表示,綜合運(yùn)用客戶端身份識(shí)別、Web頁面邏輯結(jié)構(gòu)匹配和時(shí)間屬性進(jìn)行爬蟲行為識(shí)別,然后在設(shè)定緩沖計(jì)數(shù)結(jié)構(gòu)的基礎(chǔ)上,基于識(shí)別結(jié)果進(jìn)行點(diǎn)擊計(jì)數(shù)的更新。本方法能夠正確識(shí)別爬蟲點(diǎn)擊行為,避免計(jì)數(shù)出現(xiàn)虛高現(xiàn)象,同時(shí)又能及時(shí)地進(jìn)行Web真實(shí)點(diǎn)擊計(jì)數(shù)的更新,本方法適用于各種需要進(jìn)行鏈接或頁面點(diǎn)擊計(jì)數(shù)的應(yīng)用場(chǎng)合。