一種基于url字符串的數據采集方法

基本信息

申請?zhí)?/td> CN201710440457.8 申請日 -
公開(公告)號 CN107330004A 公開(公告)日 2017-11-07
申請公布號 CN107330004A 申請公布日 2017-11-07
分類號 G06F17/30(2006.01)I 分類 計算;推算;計數;
發(fā)明人 馬建軍 申請(專利權)人 上海連源信息科技有限公司
代理機構 上海唯源專利代理有限公司 代理人 上海連源信息科技有限公司
地址 200000 上海市楊浦區(qū)閔楊樹浦路2300號1B層B05-7室
法律狀態(tài) -

摘要

摘要 一種基于url字符串的數據采集方法,通過采集系統(tǒng)在互聯網上采集符合用戶需求的數據,包括:a.采集系統(tǒng)基于用戶的輸入生成至少一個url鏈接及至少一個url鏈接配置內容;b.采集系統(tǒng)基于用戶的輸入生成至少一個核心字段以及至少一個核心字段配置內容;c.采集系統(tǒng)基于url鏈接、url鏈接配置、核心字段以及核心字段配置內容生成采集規(guī)則并基于采集規(guī)則采集數據。本發(fā)明通過用戶輸入獲取url鏈接、url鏈接配置內容、核心字段及核心字段配置內容,基于url鏈接、url鏈接配置、核心字段以及核心字段配置內容生成采集規(guī)則并基于采集規(guī)則采集數據到指定系統(tǒng),本發(fā)明操作簡單、通過靈活多變的采集規(guī)則、完善的篩選功能,實現了多元化的數據采集,具有極高的商業(yè)價值。