一種信息爬取系統(tǒng)

基本信息

申請?zhí)?/td> CN201910510474.3 申請日 -
公開(公告)號 CN111339388B 公開(公告)日 2021-07-27
申請公布號 CN111339388B 申請公布日 2021-07-27
分類號 G06F16/951(2019.01)I;G06F16/955(2019.01)I 分類 計算;推算;計數(shù);
發(fā)明人 胡崇海;熊友根;王洪濤 申請(專利權(quán))人 海通證券股份有限公司
代理機構(gòu) 北京集佳知識產(chǎn)權(quán)代理有限公司 代理人 吳敏
地址 200001上海市黃浦區(qū)廣東路689號
法律狀態(tài) -

摘要

摘要 一種信息爬取系統(tǒng),所述信息爬取系統(tǒng)包括:多個智能爬取節(jié)點,所述智能爬取節(jié)點部署在多個撥號虛擬專用服務(wù)器上,基于信息爬取時間與信息爬取狀態(tài),動態(tài)切換所述撥號虛擬專用服務(wù)器的IP地址;資源調(diào)度系統(tǒng),所述資源調(diào)度系統(tǒng)基于調(diào)度算法將待爬取鏈接分配給所述智能爬取節(jié)點以使其執(zhí)行爬取操作,并從各個智能爬取節(jié)點接收爬取結(jié)果。通過本發(fā)明提供的技術(shù)方案,可以建立穩(wěn)定的爬蟲系統(tǒng),有效應(yīng)對反爬策略,實現(xiàn)數(shù)據(jù)的持續(xù)獲取。