基于Web的爬蟲識別算法
基本信息
申請?zhí)?/td> | CN201610262526.6 | 申請日 | - |
公開(公告)號 | CN105930727A | 公開(公告)日 | 2016-09-07 |
申請公布號 | CN105930727A | 申請公布日 | 2016-09-07 |
分類號 | G06F21/56(2013.01)I;G06F17/30(2006.01)I | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 李興濤;王儒敬;王偉 | 申請(專利權)人 | 安徽中科物聯(lián)科技有限公司 |
代理機構 | 無錫市大為專利商標事務所(普通合伙) | 代理人 | 無錫中科富農物聯(lián)科技有限公司;安徽中科物聯(lián)科技有限公司;江蘇物聯(lián)網(wǎng)研究發(fā)展中心 |
地址 | 214135 江蘇省無錫市新區(qū)菱湖大道200號江蘇物聯(lián)網(wǎng)研究與發(fā)展中心C座3樓 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明提供一種基于Web的爬蟲識別算法,設置陷阱,并通過線上分析用戶訪問的行為特征判斷是爬蟲的概率;對于爬蟲可能性大的訪問者,要求驗證碼驗證,減少誤判;線下分析一天的數(shù)據(jù)通過大量數(shù)據(jù)正確的識別出隱藏性好的爬蟲;對于識別出的爬蟲加入到確定名單庫中。本發(fā)明結合了線上的實時識別和線下的正確識別,在保證識別實時性的同時,提高了識別的準確性,降低了誤判。 |
