基于Web的爬蟲識別算法

基本信息

申請?zhí)?/td> CN201610262526.6 申請日 -
公開(公告)號 CN105930727A 公開(公告)日 2016-09-07
申請公布號 CN105930727A 申請公布日 2016-09-07
分類號 G06F21/56(2013.01)I;G06F17/30(2006.01)I 分類 計算;推算;計數(shù);
發(fā)明人 李興濤;王儒敬;王偉 申請(專利權)人 安徽中科物聯(lián)科技有限公司
代理機構 無錫市大為專利商標事務所(普通合伙) 代理人 無錫中科富農物聯(lián)科技有限公司;安徽中科物聯(lián)科技有限公司;江蘇物聯(lián)網(wǎng)研究發(fā)展中心
地址 214135 江蘇省無錫市新區(qū)菱湖大道200號江蘇物聯(lián)網(wǎng)研究與發(fā)展中心C座3樓
法律狀態(tài) -

摘要

摘要 本發(fā)明提供一種基于Web的爬蟲識別算法,設置陷阱,并通過線上分析用戶訪問的行為特征判斷是爬蟲的概率;對于爬蟲可能性大的訪問者,要求驗證碼驗證,減少誤判;線下分析一天的數(shù)據(jù)通過大量數(shù)據(jù)正確的識別出隱藏性好的爬蟲;對于識別出的爬蟲加入到確定名單庫中。本發(fā)明結合了線上的實時識別和線下的正確識別,在保證識別實時性的同時,提高了識別的準確性,降低了誤判。