網(wǎng)頁獲取方法和裝置
基本信息
申請?zhí)?/td> | CN201310048765.8 | 申請日 | - |
公開(公告)號 | CN103077254B | 公開(公告)日 | 2017-11-03 |
申請公布號 | CN103077254B | 申請公布日 | 2017-11-03 |
分類號 | G06F17/30(2006.01)I | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 于維緯;劉卓 | 申請(專利權(quán))人 | 人民日報媒體技術(shù)股份有限公司 |
代理機(jī)構(gòu) | 北京匯智英財專利代理事務(wù)所(普通合伙) | 代理人 | 鄭玉潔 |
地址 | 100026 北京市朝陽區(qū)金臺西路2號【4-2】9號樓321室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本申請?zhí)峁┝艘环N網(wǎng)頁獲取方法和裝置,所述方法包括:確定抓取的網(wǎng)頁中的第一中心hub網(wǎng)頁;解析出所述第一hub網(wǎng)頁中包含的翻頁信息,所述翻頁信息包括翻頁鏈接地址;根據(jù)所述翻頁信息,生成與所述第一hub網(wǎng)頁相關(guān)的第二hub網(wǎng)頁地址;根據(jù)所述第二hub網(wǎng)頁地址,獲取內(nèi)容網(wǎng)頁。通過本申請實施例提高了網(wǎng)頁獲取時的網(wǎng)頁覆蓋率,使得能夠獲取更全面的網(wǎng)絡(luò)信息。 |
