基于事件驅(qū)動(dòng)模型的分布式互聯(lián)網(wǎng)數(shù)據(jù)采集系統(tǒng)與方法

基本信息

申請(qǐng)?zhí)?/td> CN201910599035.4 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN110347899A 公開(kāi)(公告)日 2021-06-22
申請(qǐng)公布號(hào) CN110347899A 申請(qǐng)公布日 2021-06-22
分類(lèi)號(hào) G06F16/951;G06F16/9535;G06F9/48 分類(lèi) 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 孔逸飛;段毅飛;王亮亮;薛彥文;劉博;李漁 申請(qǐng)(專(zhuān)利權(quán))人 北京熵簡(jiǎn)科技有限公司
代理機(jī)構(gòu) 上海智晟知識(shí)產(chǎn)權(quán)代理事務(wù)所(特殊普通合伙) 代理人 劉萬(wàn)磊
地址 100080 北京市海淀區(qū)中關(guān)村大街甲38號(hào)1號(hào)樓B座3層121號(hào)
法律狀態(tài) -

摘要

摘要 本發(fā)明公開(kāi)了一種基于事件驅(qū)動(dòng)模型的分布式互聯(lián)網(wǎng)數(shù)據(jù)采集系統(tǒng)及方法,涉及網(wǎng)絡(luò)搜索技術(shù)領(lǐng)域,系統(tǒng)包括控制臺(tái)模塊、數(shù)據(jù)采集引擎模塊、數(shù)據(jù)存儲(chǔ)模塊、日志服務(wù)模塊,并運(yùn)行在容器編排引擎之上;控制臺(tái)模塊對(duì)數(shù)據(jù)采集和數(shù)據(jù)存儲(chǔ)進(jìn)行配置;數(shù)據(jù)采集引擎模塊根據(jù)控制臺(tái)模塊的配置完成數(shù)據(jù)采集;數(shù)據(jù)存儲(chǔ)模塊與數(shù)據(jù)采集引擎模塊連接,根據(jù)控制臺(tái)模塊的配置完成數(shù)據(jù)存儲(chǔ);控制臺(tái)模塊、數(shù)據(jù)采集引擎模塊、數(shù)據(jù)存儲(chǔ)模塊和日志服務(wù)模塊都各包含一項(xiàng)或多項(xiàng)服務(wù);服務(wù)互相解耦,以獨(dú)立Docker鏡像的形式部署于容器編排引擎之上。本發(fā)明具備快速地動(dòng)態(tài)擴(kuò)容和縮容的能力,支持日采集TB量級(jí)別海量數(shù)據(jù)的需求,并支持同時(shí)對(duì)上千種不同來(lái)源的網(wǎng)站進(jìn)行數(shù)據(jù)采集。