一種數(shù)據(jù)爬取方法和系統(tǒng)

基本信息

申請?zhí)?/td> CN201810508823.3 申請日 -
公開(公告)號 CN108846025A 公開(公告)日 2018-11-20
申請公布號 CN108846025A 申請公布日 2018-11-20
分類號 G06F17/30 分類 計算;推算;計數(shù);
發(fā)明人 向開娓 申請(專利權(quán))人 上海鋼聯(lián)電子商務(wù)股份有限公司
代理機構(gòu) 北京維正專利代理有限公司 代理人 洪敏;謝緒寧
地址 201900 上海市寶山區(qū)園豐路68號
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種數(shù)據(jù)爬取方法和系統(tǒng),涉及數(shù)據(jù)采集技術(shù)領(lǐng)域,解決了現(xiàn)有技術(shù)爬取對象單一,數(shù)據(jù)管理不夠完善,數(shù)據(jù)爬取不夠系統(tǒng)化的缺點。該方法包括:將數(shù)據(jù)進行分類;根據(jù)采集任務(wù)對數(shù)據(jù)進行爬??;查詢采集成功的指標數(shù)據(jù)結(jié)果和異常結(jié)果。通過對所要爬取的數(shù)據(jù)進行分類,根據(jù)管理員的需求設(shè)置對應(yīng)的采集任務(wù),能夠提高數(shù)據(jù)的提取效率,而根據(jù)是否已采集過數(shù)據(jù)的指標來選擇數(shù)據(jù)采集規(guī)則,避免了數(shù)據(jù)的重復采集和遺漏。