一種對(duì)訪問(wèn)次數(shù)有限制的網(wǎng)站防封禁方法及系統(tǒng)
基本信息
申請(qǐng)?zhí)?/td> | CN201911353733.2 | 申請(qǐng)日 | - |
公開(kāi)(公告)號(hào) | CN113037692A | 公開(kāi)(公告)日 | 2021-06-25 |
申請(qǐng)公布號(hào) | CN113037692A | 申請(qǐng)公布日 | 2021-06-25 |
分類號(hào) | H04L29/06 | 分類 | 電通信技術(shù); |
發(fā)明人 | 孫香娟;李鑫;周彥其;姜波 | 申請(qǐng)(專利權(quán))人 | 中文在線集團(tuán)股份有限公司 |
代理機(jī)構(gòu) | 北京市盛峰律師事務(wù)所 | 代理人 | 于國(guó)強(qiáng) |
地址 | 100005 北京市東城區(qū)東總布胡同58號(hào)天潤(rùn)財(cái)富中心14層1401單元 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開(kāi)了一種對(duì)訪問(wèn)次數(shù)有限制的網(wǎng)站防封禁方法及系統(tǒng),所述方法包括S1、目標(biāo)瀏覽器使用selenium訪問(wèn)網(wǎng)站登錄頁(yè)面;S2、當(dāng)網(wǎng)站登錄頁(yè)面加載完畢后,循環(huán)獲取準(zhǔn)備好的用戶名和密碼,并將獲取的用戶名和密碼填充到網(wǎng)站登錄頁(yè)面;S3、登錄網(wǎng)站,獲取登錄結(jié)果的cookie,并返回response body;S4、解析response body,獲取set cookie中的內(nèi)容;S5、判斷獲取的登錄結(jié)果的cookie的是否有效,并將過(guò)期的cookie剔除,保存剩余的有效cookie;S6、調(diào)用保存的有效cookie,即可直接采集網(wǎng)站數(shù)據(jù)。優(yōu)點(diǎn)是:實(shí)現(xiàn)了快速登錄的效果,并通過(guò)對(duì)cookie的管理,有效控制cookie使用的閾值,達(dá)到防止被網(wǎng)站限制訪問(wèn)的目的。 |
