基于Web的爬蟲識(shí)別方法

基本信息

申請(qǐng)?zhí)?/td> CN201610262526.6 申請(qǐng)日 -
公開(公告)號(hào) CN105930727B 公開(公告)日 2018-11-09
申請(qǐng)公布號(hào) CN105930727B 申請(qǐng)公布日 2018-11-09
分類號(hào) G06F21/56;G06F17/30 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 李興濤;王儒敬;王偉 申請(qǐng)(專利權(quán))人 無錫中科富創(chuàng)科技孵化有限公司
代理機(jī)構(gòu) 無錫市大為專利商標(biāo)事務(wù)所(普通合伙) 代理人 無錫中科富農(nóng)物聯(lián)科技有限公司;安徽中科物聯(lián)科技有限公司;江蘇物聯(lián)網(wǎng)研究發(fā)展中心
地址 214135 江蘇省無錫市新區(qū)菱湖大道200號(hào)江蘇物聯(lián)網(wǎng)研究與發(fā)展中心C座3樓
法律狀態(tài) -

摘要

摘要 本發(fā)明提供一種基于Web的爬蟲識(shí)別算法,設(shè)置陷阱,并通過線上分析用戶訪問的行為特征判斷是爬蟲的概率;對(duì)于爬蟲可能性大的訪問者,要求驗(yàn)證碼驗(yàn)證,減少誤判;線下分析一天的數(shù)據(jù)通過大量數(shù)據(jù)正確的識(shí)別出隱藏性好的爬蟲;對(duì)于識(shí)別出的爬蟲加入到確定名單庫中。本發(fā)明結(jié)合了線上的實(shí)時(shí)識(shí)別和線下的正確識(shí)別,在保證識(shí)別實(shí)時(shí)性的同時(shí),提高了識(shí)別的準(zhǔn)確性,降低了誤判。