基于大數(shù)據(jù)的網(wǎng)絡(luò)數(shù)據(jù)抓取方法

基本信息

申請?zhí)?/td> CN202010187194.6 申請日 -
公開(公告)號 CN111414524A 公開(公告)日 2020-07-14
申請公布號 CN111414524A 申請公布日 2020-07-14
分類號 G06F16/951(2019.01)I 分類 -
發(fā)明人 張俊杰;耿雁萍 申請(專利權(quán))人 安徽火藍數(shù)據(jù)有限公司
代理機構(gòu) 北京風雅頌專利代理有限公司 代理人 王剛
地址 241000安徽省蕪湖市鳩江區(qū)國泰路2號中國電信集團蕪湖云計算中心4樓(申報承諾)
法律狀態(tài) -

摘要

摘要 本發(fā)明提供了一種基于大數(shù)據(jù)的網(wǎng)絡(luò)數(shù)據(jù)抓取方法,包括將監(jiān)聽終端配置為代理服務器;目標APP通過所述代理服務器向目標服務器發(fā)送通信數(shù)據(jù);所述代理服務器模擬所述目標APP向所述目標服務器發(fā)送通信數(shù)據(jù);所述代理服務器根據(jù)大數(shù)據(jù)分析獲得目標字段;配置抓取規(guī)則,所述代理服務器根據(jù)所述目標字段抓取所述目標服務器發(fā)送的數(shù)據(jù)。本發(fā)明通過將監(jiān)聽終端配置為代理服務器,代理服務器模擬所述目標APP向所述目標服務器發(fā)送通信數(shù)據(jù),在通過大數(shù)據(jù)分析或者目標字段之后,配置抓取規(guī)則,所述代理服務器根據(jù)所述目標字段抓取所述目標服務器發(fā)送的數(shù)據(jù)。從而能夠自動抓取網(wǎng)絡(luò)新聞熱點,無需人工進行配置,高效化、智能化。??