網(wǎng)絡(luò)信息獲取方法、裝置和電子設(shè)備

基本信息

申請(qǐng)?zhí)?/td> CN202010784498.0 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN112131448A 公開(kāi)(公告)日 2020-12-25
申請(qǐng)公布號(hào) CN112131448A 申請(qǐng)公布日 2020-12-25
分類(lèi)號(hào) G06F16/951(2019.01)I 分類(lèi) 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 楊碩;官延斌;王庚 申請(qǐng)(專(zhuān)利權(quán))人 億存(北京)信息科技有限公司
代理機(jī)構(gòu) 北京清亦華知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 白雪靜
地址 100124北京市朝陽(yáng)區(qū)高碑店鄉(xiāng)半壁店村惠河南街1088號(hào)2層201
法律狀態(tài) -

摘要

摘要 本發(fā)明公開(kāi)了一種網(wǎng)絡(luò)信息獲取方法、裝置和電子設(shè)備。該獲取方法包括:獲取目標(biāo)網(wǎng)頁(yè)的統(tǒng)一資源定位器URL,其中,目標(biāo)網(wǎng)頁(yè)為當(dāng)前需要進(jìn)行網(wǎng)絡(luò)信息采集的網(wǎng)頁(yè);根據(jù)所述URL,下載目標(biāo)網(wǎng)頁(yè)進(jìn)行緩存;根據(jù)目標(biāo)網(wǎng)頁(yè),生成目標(biāo)網(wǎng)頁(yè)對(duì)應(yīng)的網(wǎng)頁(yè)圖片;對(duì)網(wǎng)頁(yè)圖片進(jìn)行圖像識(shí)別,以獲取目標(biāo)網(wǎng)頁(yè)攜帶的頁(yè)面元素和頁(yè)面元素對(duì)應(yīng)的內(nèi)容。本發(fā)明實(shí)施例的獲取方法,能夠?qū)⒛繕?biāo)網(wǎng)頁(yè)轉(zhuǎn)化成圖片,并對(duì)圖片進(jìn)行圖像識(shí)別以獲取目標(biāo)網(wǎng)頁(yè)攜帶的頁(yè)面元素及其對(duì)應(yīng)的內(nèi)容,以實(shí)現(xiàn)網(wǎng)頁(yè)信息的獲取,相較于相關(guān)技術(shù)中開(kāi)發(fā)人員根據(jù)不同的網(wǎng)頁(yè)編寫(xiě)不同的爬蟲(chóng)代碼,該方法適用于萬(wàn)維網(wǎng)中所有網(wǎng)頁(yè)的信息獲取,節(jié)省了大量的人力和時(shí)間成本,程序開(kāi)發(fā)效率較高。??