基于分布式網(wǎng)絡(luò)爬蟲的地理空間數(shù)據(jù)獲取系統(tǒng)及方法

基本信息

申請?zhí)?/td> CN202110640002.7 申請日 -
公開(公告)號 CN113254747B 公開(公告)日 2021-10-15
申請公布號 CN113254747B 申請公布日 2021-10-15
分類號 G06F16/951(2019.01)I;G06F16/9537(2019.01)I;G06F16/29(2019.01)I;G06F16/25(2019.01)I;G06F9/50(2006.01)I 分類 計算;推算;計數(shù);
發(fā)明人 杜志強;咼維 申請(專利權(quán))人 南京北斗創(chuàng)新應用科技研究院有限公司
代理機構(gòu) 南京創(chuàng)略知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 閆方圓
地址 210000江蘇省南京市六合區(qū)龍池街道虎躍東路8號
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種基于分布式網(wǎng)絡(luò)爬蟲的地理空間數(shù)據(jù)獲取系統(tǒng)及方法,系統(tǒng)包括用戶需求發(fā)布模塊、調(diào)度引擎服務(wù)模塊、可執(zhí)行爬蟲程序集模塊、HTCondor集群模塊和分布式爬蟲數(shù)據(jù)庫模塊,通過網(wǎng)絡(luò)爬蟲的方式進行互聯(lián)網(wǎng)空間信息采集,抽取出目標數(shù)據(jù)及時存入數(shù)據(jù)庫中,可以為對泛在地理空間數(shù)據(jù)進行進一步的管理使用提供了數(shù)據(jù)基礎(chǔ)。清楚各種來源數(shù)據(jù)的特點和共同之處。通過歸類總結(jié)不同類型數(shù)據(jù)、不同來源數(shù)據(jù)的獲取方法,針對重要的泛在地理空間數(shù)據(jù)源設(shè)計定制化的數(shù)據(jù)獲取應用,并將其融合到分布式爬蟲框架中進行綜合調(diào)度管理,可以實現(xiàn)良好的泛在數(shù)據(jù)獲取效果。