網(wǎng)絡(luò)爬蟲系統(tǒng)及方法

基本信息

申請?zhí)?/td> CN201910017134.7 申請日 -
公開(公告)號 CN109783715A 公開(公告)日 2019-05-21
申請公布號 CN109783715A 申請公布日 2019-05-21
分類號 G06F16/951(2019.01)I 分類 計算;推算;計數(shù);
發(fā)明人 郭星星 申請(專利權(quán))人 鑫涌算力信息科技(上海)有限公司
代理機構(gòu) 上海翰信知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 鑫涌算力信息科技(上海)有限公司
地址 200090 上海市楊浦區(qū)黃興路2218號第28層2808室
法律狀態(tài) -

摘要

摘要 本公開提供了一種網(wǎng)絡(luò)爬蟲系統(tǒng)及方法,所述網(wǎng)絡(luò)爬蟲系統(tǒng)可以在用戶授權(quán)的情況下自動抓取網(wǎng)絡(luò)特定信息,所述用戶交互模塊獲取了用戶授權(quán)信息之后用把相關(guān)的授權(quán)信息提交到調(diào)度處理模塊,由調(diào)度模塊處理抓取相應(yīng)的規(guī)則,解決了普通網(wǎng)絡(luò)爬蟲無法對于特定私有信息的自動化獲取。同時,所述網(wǎng)絡(luò)爬蟲系統(tǒng)使用消息隊列,作為中間件,來實現(xiàn)異步解耦,所述網(wǎng)絡(luò)爬蟲系統(tǒng)采用異步的請求方式來處理任務(wù),系統(tǒng)結(jié)構(gòu)易于拓展,各層連接通過消息隊列來處理,使爬蟲任務(wù)有了下發(fā)式,避免了重復(fù)任務(wù)的情況,增加了系統(tǒng)的穩(wěn)定性,大大提高了用戶響應(yīng)時間,充分利用了系統(tǒng)資源,提高了系統(tǒng)的并發(fā)量,系統(tǒng)利用率大大提升。