一種無中心的分布式互聯(lián)網(wǎng)信息推送式采集系統(tǒng)
基本信息
申請(qǐng)?zhí)?/td> | CN202210414450.X | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN114745430A | 公開(公告)日 | 2022-07-12 |
申請(qǐng)公布號(hào) | CN114745430A | 申請(qǐng)公布日 | 2022-07-12 |
分類號(hào) | H04L67/55(2022.01)I;H04L69/16(2022.01)I;H04L67/02(2022.01)I | 分類 | 電通信技術(shù); |
發(fā)明人 | 岳洋;陳德全 | 申請(qǐng)(專利權(quán))人 | 盟浪可持續(xù)數(shù)字科技(深圳)有限責(zé)任公司 |
代理機(jī)構(gòu) | 深圳市博太聯(lián)眾專利代理事務(wù)所(特殊普通合伙) | 代理人 | - |
地址 | 518000廣東省深圳市前海深港合作區(qū)前灣一路1號(hào)A棟201室(入駐深圳市前海商務(wù)秘書有限公司) | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明提供一種無中心的分布式互聯(lián)網(wǎng)信息推送式采集系統(tǒng),涉及互聯(lián)網(wǎng)領(lǐng)域。該無中心的分布式互聯(lián)網(wǎng)信息推送式采集系統(tǒng),包括分布式系統(tǒng)構(gòu)建、添加任務(wù)、單一節(jié)點(diǎn)運(yùn)行流程、多節(jié)點(diǎn)協(xié)同。通過拋棄了傳統(tǒng)的主動(dòng)抓取技術(shù),采用消息推送機(jī)制,實(shí)現(xiàn)了目標(biāo)網(wǎng)站向抓取系統(tǒng)主動(dòng)推送信息的方式完成信息采集,當(dāng)關(guān)注的消息網(wǎng)站有任何新內(nèi)容出現(xiàn)后,觸發(fā)網(wǎng)站推送事件,通過已經(jīng)構(gòu)建的推送通道,將信息推送到抓取系統(tǒng)后臺(tái)的接收端,通過這樣的方式,減少了主動(dòng)抓取的成本,降低了被目標(biāo)網(wǎng)站封禁的可能,提高了信息更新的及時(shí)性,將信息采集方式由主動(dòng)爬取變?yōu)槟繕?biāo)網(wǎng)站主動(dòng)推送,降低信息采集的設(shè)備和網(wǎng)絡(luò)成本,提高采集時(shí)效性,杜絕被目標(biāo)網(wǎng)站攔截的可能。 |
