一種對(duì)訪問(wèn)次數(shù)有限制的網(wǎng)站防封禁方法及系統(tǒng)

基本信息

申請(qǐng)?zhí)?/td> CN201911353733.2 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN113037692A 公開(kāi)(公告)日 2021-06-25
申請(qǐng)公布號(hào) CN113037692A 申請(qǐng)公布日 2021-06-25
分類號(hào) H04L29/06 分類 電通信技術(shù);
發(fā)明人 孫香娟;李鑫;周彥其;姜波 申請(qǐng)(專利權(quán))人 中文在線集團(tuán)股份有限公司
代理機(jī)構(gòu) 北京市盛峰律師事務(wù)所 代理人 于國(guó)強(qiáng)
地址 100005 北京市東城區(qū)東總布胡同58號(hào)天潤(rùn)財(cái)富中心14層1401單元
法律狀態(tài) -

摘要

摘要 本發(fā)明公開(kāi)了一種對(duì)訪問(wèn)次數(shù)有限制的網(wǎng)站防封禁方法及系統(tǒng),所述方法包括S1、目標(biāo)瀏覽器使用selenium訪問(wèn)網(wǎng)站登錄頁(yè)面;S2、當(dāng)網(wǎng)站登錄頁(yè)面加載完畢后,循環(huán)獲取準(zhǔn)備好的用戶名和密碼,并將獲取的用戶名和密碼填充到網(wǎng)站登錄頁(yè)面;S3、登錄網(wǎng)站,獲取登錄結(jié)果的cookie,并返回response body;S4、解析response body,獲取set cookie中的內(nèi)容;S5、判斷獲取的登錄結(jié)果的cookie的是否有效,并將過(guò)期的cookie剔除,保存剩余的有效cookie;S6、調(diào)用保存的有效cookie,即可直接采集網(wǎng)站數(shù)據(jù)。優(yōu)點(diǎn)是:實(shí)現(xiàn)了快速登錄的效果,并通過(guò)對(duì)cookie的管理,有效控制cookie使用的閾值,達(dá)到防止被網(wǎng)站限制訪問(wèn)的目的。