一種基于Jxbrowser的網(wǎng)頁(yè)采集技術(shù)

基本信息

申請(qǐng)?zhí)?/td> CN202010303619.5 申請(qǐng)日 -
公開(公告)號(hào) CN111523064A 公開(公告)日 2020-08-11
申請(qǐng)公布號(hào) CN111523064A 申請(qǐng)公布日 2020-08-11
分類號(hào) G06F16/955(2019.01)I 分類 -
發(fā)明人 徐利東;遠(yuǎn)貴良 申請(qǐng)(專利權(quán))人 山東貝賽信息科技有限公司
代理機(jī)構(gòu) 濟(jì)南瑞宸知識(shí)產(chǎn)權(quán)代理有限公司 代理人 山東貝賽信息科技有限公司
地址 250000山東省濟(jì)南市經(jīng)十路7000號(hào)漢峪金谷金融商務(wù)中心A4-(3)辦公樓34層3401室
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種基于Jxbrowser的網(wǎng)頁(yè)采集技術(shù),步驟1:數(shù)據(jù)初始化;步驟2:保存路徑;步驟3:代理ip地址和端口;步驟4:加載數(shù)據(jù)完成初始化;步驟5:資源定位;步驟6:獲取內(nèi)容;步驟7:完成采集。本發(fā)明可實(shí)現(xiàn)如下技術(shù)效果,可實(shí)現(xiàn)了對(duì)動(dòng)態(tài)網(wǎng)頁(yè)的采集,可實(shí)現(xiàn)了對(duì)加密網(wǎng)頁(yè)的采集,采集效率比同類的技術(shù)效率大幅度提升,支持通過(guò)代理ip訪問(wèn)網(wǎng)頁(yè)地址。??