網(wǎng)絡(luò)資源獲取方法及裝置
基本信息
申請(qǐng)?zhí)?/td> | CN202110714037.0 | 申請(qǐng)日 | - |
公開(kāi)(公告)號(hào) | CN113343152A | 公開(kāi)(公告)日 | 2021-09-03 |
申請(qǐng)公布號(hào) | CN113343152A | 申請(qǐng)公布日 | 2021-09-03 |
分類號(hào) | G06F16/958(2019.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 何少華 | 申請(qǐng)(專利權(quán))人 | 咪咕數(shù)字傳媒有限公司 |
代理機(jī)構(gòu) | 北京市浩天知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) | 代理人 | 趙婭 |
地址 | 310018浙江省杭州市西湖區(qū)西溪銀座1幢1層101室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開(kāi)了一種網(wǎng)絡(luò)資源獲取方法及裝置,方法包括:獲取用戶輸入的起始頁(yè)面地址,對(duì)起始頁(yè)面進(jìn)行頁(yè)面請(qǐng)求,得到對(duì)應(yīng)的起始頁(yè)面源碼信息;對(duì)起始頁(yè)面源碼信息進(jìn)行解析處理,提取二級(jí)頁(yè)面地址集合;啟動(dòng)代理服務(wù),創(chuàng)建瀏覽器代理依次請(qǐng)求二級(jí)頁(yè)面地址集合中的二級(jí)頁(yè)面地址,加載對(duì)應(yīng)的二級(jí)頁(yè)面;利用代理服務(wù)的har參數(shù)獲取頁(yè)面請(qǐng)求中的信息實(shí)體;對(duì)信息實(shí)體進(jìn)行篩選處理,確實(shí)目標(biāo)網(wǎng)絡(luò)資源的下載地址,保存至地址隊(duì)列中;重復(fù)上述操作,直至遍歷二級(jí)頁(yè)面地址集合中全部的二級(jí)頁(yè)面地址;根據(jù)地址隊(duì)列包含的目標(biāo)網(wǎng)絡(luò)資源的下載地址,下載對(duì)應(yīng)的目標(biāo)網(wǎng)絡(luò)資源。能夠批量下載外部動(dòng)態(tài)的目標(biāo)網(wǎng)絡(luò)資源,無(wú)需如現(xiàn)有下載工具需滿足各種限制,更靈活。 |
