一種微博信息抓取方法及裝置
基本信息
申請?zhí)?/td> | CN201310334946.7 | 申請日 | - |
公開(公告)號 | CN103366018B | 公開(公告)日 | 2017-11-03 |
申請公布號 | CN103366018B | 申請公布日 | 2017-11-03 |
分類號 | G06F17/30(2006.01)I | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 韓中騰;崔世起 | 申請(專利權(quán))人 | 人民搜索網(wǎng)絡(luò)股份公司 |
代理機(jī)構(gòu) | 北京集佳知識產(chǎn)權(quán)代理有限公司 | 代理人 | 王寶筠 |
地址 | 100026 北京市朝陽區(qū)金臺西路2號[4-1]15幢3層370室 | ||
法律狀態(tài) | - |
摘要
摘要 | 一種微博信息抓取方法及裝置,所述方法包括:獲取待抓取微博用戶,并判斷所述待抓取微博用戶的類型;如果所述待抓取微博用戶為活躍用戶,則計算該待抓取微博用戶的抓取周期,并根據(jù)所述抓取周期預(yù)測抓取時間點進(jìn)行微博信息抓?。蝗绻龃ト∥⒉┯脩魹榉腔钴S用戶,則獲取該待抓取微博用戶的抓取狀態(tài)以及剩余抓取用戶量,如果所述抓取狀態(tài)表示能進(jìn)行微博信息抓取,且所述剩余抓取用戶量不為零,則對所述待抓取微博用戶進(jìn)行微博信息抓取。本發(fā)明通過對不同類型的用戶進(jìn)行區(qū)別處理的方式,實現(xiàn)了抓取資源的合理分配與使用,提高了資源利用率,同時還能保證每次抓取過程均能抓取到較多的微博信息,提高了信息抓取效率。 |
