一種網(wǎng)絡(luò)大數(shù)據(jù)信息聚合爬蟲系統(tǒng)及方法

基本信息

申請?zhí)?/td> CN201910320017.8 申請日 -
公開(公告)號(hào) CN111831877A 公開(公告)日 2020-10-27
申請公布號(hào) CN111831877A 申請公布日 2020-10-27
分類號(hào) G06F16/951(2019.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 汪遠(yuǎn) 申請(專利權(quán))人 上海朋數(shù)信息科技有限公司
代理機(jī)構(gòu) 上海宏京知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 上海朋數(shù)信息科技有限公司
地址 200080上海市虹口區(qū)海寧路137號(hào)7層F座786V室
法律狀態(tài) -

摘要

摘要 本發(fā)明屬于計(jì)算機(jī)技術(shù)領(lǐng)域,具體涉及一種網(wǎng)絡(luò)大數(shù)據(jù)信息聚合爬蟲系統(tǒng)及方法。信息抓取單元,用于抓取目標(biāo)信息;信息處理單元,用于進(jìn)行爬取內(nèi)容信息相似度檢測,將所述爬取得到的網(wǎng)絡(luò)信息進(jìn)行篩選;聚合分類單元,用于對篩選過的信息按類別、熱度、關(guān)鍵字進(jìn)行分類排序。具有效率高、響應(yīng)快和精確度高的優(yōu)點(diǎn)。??