一種無中心的分布式互聯(lián)網(wǎng)信息推送式采集系統(tǒng)

基本信息

申請(qǐng)?zhí)?/td> CN202210414450.X 申請(qǐng)日 -
公開(公告)號(hào) CN114745430A 公開(公告)日 2022-07-12
申請(qǐng)公布號(hào) CN114745430A 申請(qǐng)公布日 2022-07-12
分類號(hào) H04L67/55(2022.01)I;H04L69/16(2022.01)I;H04L67/02(2022.01)I 分類 電通信技術(shù);
發(fā)明人 岳洋;陳德全 申請(qǐng)(專利權(quán))人 盟浪可持續(xù)數(shù)字科技(深圳)有限責(zé)任公司
代理機(jī)構(gòu) 深圳市博太聯(lián)眾專利代理事務(wù)所(特殊普通合伙) 代理人 -
地址 518000廣東省深圳市前海深港合作區(qū)前灣一路1號(hào)A棟201室(入駐深圳市前海商務(wù)秘書有限公司)
法律狀態(tài) -

摘要

摘要 本發(fā)明提供一種無中心的分布式互聯(lián)網(wǎng)信息推送式采集系統(tǒng),涉及互聯(lián)網(wǎng)領(lǐng)域。該無中心的分布式互聯(lián)網(wǎng)信息推送式采集系統(tǒng),包括分布式系統(tǒng)構(gòu)建、添加任務(wù)、單一節(jié)點(diǎn)運(yùn)行流程、多節(jié)點(diǎn)協(xié)同。通過拋棄了傳統(tǒng)的主動(dòng)抓取技術(shù),采用消息推送機(jī)制,實(shí)現(xiàn)了目標(biāo)網(wǎng)站向抓取系統(tǒng)主動(dòng)推送信息的方式完成信息采集,當(dāng)關(guān)注的消息網(wǎng)站有任何新內(nèi)容出現(xiàn)后,觸發(fā)網(wǎng)站推送事件,通過已經(jīng)構(gòu)建的推送通道,將信息推送到抓取系統(tǒng)后臺(tái)的接收端,通過這樣的方式,減少了主動(dòng)抓取的成本,降低了被目標(biāo)網(wǎng)站封禁的可能,提高了信息更新的及時(shí)性,將信息采集方式由主動(dòng)爬取變?yōu)槟繕?biāo)網(wǎng)站主動(dòng)推送,降低信息采集的設(shè)備和網(wǎng)絡(luò)成本,提高采集時(shí)效性,杜絕被目標(biāo)網(wǎng)站攔截的可能。