基于大數(shù)據(jù)的網(wǎng)絡(luò)數(shù)據(jù)抓取方法

基本信息

申請(qǐng)?zhí)?/td> CN202010187194.6 申請(qǐng)日 -
公開(公告)號(hào) CN111414524A 公開(公告)日 2020-07-14
申請(qǐng)公布號(hào) CN111414524A 申請(qǐng)公布日 2020-07-14
分類號(hào) G06F16/951(2019.01)I 分類 -
發(fā)明人 張俊杰;耿雁萍 申請(qǐng)(專利權(quán))人 安徽火藍(lán)數(shù)據(jù)有限公司
代理機(jī)構(gòu) 北京風(fēng)雅頌專利代理有限公司 代理人 王剛
地址 241000安徽省蕪湖市鳩江區(qū)國泰路2號(hào)中國電信集團(tuán)蕪湖云計(jì)算中心4樓(申報(bào)承諾)
法律狀態(tài) -

摘要

摘要 本發(fā)明提供了一種基于大數(shù)據(jù)的網(wǎng)絡(luò)數(shù)據(jù)抓取方法,包括將監(jiān)聽終端配置為代理服務(wù)器;目標(biāo)APP通過所述代理服務(wù)器向目標(biāo)服務(wù)器發(fā)送通信數(shù)據(jù);所述代理服務(wù)器模擬所述目標(biāo)APP向所述目標(biāo)服務(wù)器發(fā)送通信數(shù)據(jù);所述代理服務(wù)器根據(jù)大數(shù)據(jù)分析獲得目標(biāo)字段;配置抓取規(guī)則,所述代理服務(wù)器根據(jù)所述目標(biāo)字段抓取所述目標(biāo)服務(wù)器發(fā)送的數(shù)據(jù)。本發(fā)明通過將監(jiān)聽終端配置為代理服務(wù)器,代理服務(wù)器模擬所述目標(biāo)APP向所述目標(biāo)服務(wù)器發(fā)送通信數(shù)據(jù),在通過大數(shù)據(jù)分析或者目標(biāo)字段之后,配置抓取規(guī)則,所述代理服務(wù)器根據(jù)所述目標(biāo)字段抓取所述目標(biāo)服務(wù)器發(fā)送的數(shù)據(jù)。從而能夠自動(dòng)抓取網(wǎng)絡(luò)新聞熱點(diǎn),無需人工進(jìn)行配置,高效化、智能化。??