一種基于半監(jiān)督的反爬蟲系統(tǒng)及設(shè)計方法
基本信息
申請?zhí)?/td> | CN202010655940.X | 申請日 | - |
公開(公告)號 | CN111914905B | 公開(公告)日 | 2021-07-20 |
申請公布號 | CN111914905B | 申請公布日 | 2021-07-20 |
分類號 | G06K9/62;G06F21/56;G06N20/00 | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 簡軍;高熙;蔡月月 | 申請(專利權(quán))人 | 北京人人云圖信息技術(shù)有限公司 |
代理機(jī)構(gòu) | 北京中創(chuàng)云知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) | 代理人 | 肖佳 |
地址 | 100191 北京市海淀區(qū)北四環(huán)中路238號柏彥大廈11層1106室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種基于半監(jiān)督的反爬蟲系統(tǒng)及設(shè)計方法,包括衍生特征向量,無監(jiān)督聚類成簇,專家規(guī)則評估,強(qiáng)化規(guī)則,機(jī)器學(xué)習(xí),輸出識別爬蟲概率結(jié)果;通過無監(jiān)督算法對請求行為進(jìn)行聚類得到不同的簇;通過專家規(guī)則對不同的簇行為進(jìn)行爬蟲概率計算;對于概率高于某個閾值的行為添加到規(guī)則系統(tǒng)里;對于概率在某個閾值范圍的行為作為維度送進(jìn)機(jī)器學(xué)習(xí)系統(tǒng)進(jìn)行訓(xùn)練和預(yù)測,能夠解決爬蟲行為多變的問題并提高防護(hù)性能,降低誤殺風(fēng)險。 |
