一種網(wǎng)絡(luò)大數(shù)據(jù)信息聚合爬蟲系統(tǒng)及方法
基本信息
申請?zhí)?/td> | CN201910320017.8 | 申請日 | - |
公開(公告)號(hào) | CN111831877A | 公開(公告)日 | 2020-10-27 |
申請公布號(hào) | CN111831877A | 申請公布日 | 2020-10-27 |
分類號(hào) | G06F16/951(2019.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 汪遠(yuǎn) | 申請(專利權(quán))人 | 上海朋數(shù)信息科技有限公司 |
代理機(jī)構(gòu) | 上海宏京知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) | 代理人 | 上海朋數(shù)信息科技有限公司 |
地址 | 200080上海市虹口區(qū)海寧路137號(hào)7層F座786V室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明屬于計(jì)算機(jī)技術(shù)領(lǐng)域,具體涉及一種網(wǎng)絡(luò)大數(shù)據(jù)信息聚合爬蟲系統(tǒng)及方法。信息抓取單元,用于抓取目標(biāo)信息;信息處理單元,用于進(jìn)行爬取內(nèi)容信息相似度檢測,將所述爬取得到的網(wǎng)絡(luò)信息進(jìn)行篩選;聚合分類單元,用于對篩選過的信息按類別、熱度、關(guān)鍵字進(jìn)行分類排序。具有效率高、響應(yīng)快和精確度高的優(yōu)點(diǎn)。?? |
