網(wǎng)頁獲取方法和裝置
基本信息
申請?zhí)?/td> | CN201310048765.8 | 申請日 | - |
公開(公告)號 | CN103077254A | 公開(公告)日 | 2013-05-01 |
申請公布號 | CN103077254A | 申請公布日 | 2013-05-01 |
分類號 | G06F17/30(2006.01)I | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 于維緯;劉卓 | 申請(專利權(quán))人 | 人民日報媒體技術(shù)股份有限公司 |
代理機(jī)構(gòu) | 北京集佳知識產(chǎn)權(quán)代理有限公司 | 代理人 | 人民搜索網(wǎng)絡(luò)股份公司;人民日報媒體技術(shù)股份有限公司 |
地址 | 100026 北京市朝陽區(qū)金臺西路2號【4-2】9號樓321室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本申請?zhí)峁┝艘环N網(wǎng)頁獲取方法和裝置,所述方法包括:確定抓取的網(wǎng)頁中的第一中心hub網(wǎng)頁;解析出所述第一hub網(wǎng)頁中包含的翻頁信息,所述翻頁信息包括翻頁鏈接地址;根據(jù)所述翻頁信息,生成與所述第一hub網(wǎng)頁相關(guān)的第二hub網(wǎng)頁地址;根據(jù)所述第二hub網(wǎng)頁地址,獲取內(nèi)容網(wǎng)頁。通過本申請實(shí)施例提高了網(wǎng)頁獲取時的網(wǎng)頁覆蓋率,使得能夠獲取更全面的網(wǎng)絡(luò)信息。 |
