基于事件驅動模型的分布式互聯(lián)網(wǎng)數(shù)據(jù)采集系統(tǒng)與方法
基本信息
申請?zhí)?/td> | CN201910599035.4 | 申請日 | - |
公開(公告)號 | CN110347899A | 公開(公告)日 | 2021-06-22 |
申請公布號 | CN110347899A | 申請公布日 | 2021-06-22 |
分類號 | G06F16/951;G06F16/9535;G06F9/48 | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 孔逸飛;段毅飛;王亮亮;薛彥文;劉博;李漁 | 申請(專利權)人 | 北京熵簡科技有限公司 |
代理機構 | 上海智晟知識產(chǎn)權代理事務所(特殊普通合伙) | 代理人 | 劉萬磊 |
地址 | 100080 北京市海淀區(qū)中關村大街甲38號1號樓B座3層121號 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種基于事件驅動模型的分布式互聯(lián)網(wǎng)數(shù)據(jù)采集系統(tǒng)及方法,涉及網(wǎng)絡搜索技術領域,系統(tǒng)包括控制臺模塊、數(shù)據(jù)采集引擎模塊、數(shù)據(jù)存儲模塊、日志服務模塊,并運行在容器編排引擎之上;控制臺模塊對數(shù)據(jù)采集和數(shù)據(jù)存儲進行配置;數(shù)據(jù)采集引擎模塊根據(jù)控制臺模塊的配置完成數(shù)據(jù)采集;數(shù)據(jù)存儲模塊與數(shù)據(jù)采集引擎模塊連接,根據(jù)控制臺模塊的配置完成數(shù)據(jù)存儲;控制臺模塊、數(shù)據(jù)采集引擎模塊、數(shù)據(jù)存儲模塊和日志服務模塊都各包含一項或多項服務;服務互相解耦,以獨立Docker鏡像的形式部署于容器編排引擎之上。本發(fā)明具備快速地動態(tài)擴容和縮容的能力,支持日采集TB量級別海量數(shù)據(jù)的需求,并支持同時對上千種不同來源的網(wǎng)站進行數(shù)據(jù)采集。 |
