一種信息爬取方法、裝置、設(shè)備及計算機可讀存儲介質(zhì)

基本信息

申請?zhí)?/td> CN201811564176.4 申請日 -
公開(公告)號 CN109815380A 公開(公告)日 2019-05-28
申請公布號 CN109815380A 申請公布日 2019-05-28
分類號 G06F16/951(2019.01)I 分類 計算;推算;計數(shù);
發(fā)明人 盧祎明; 溫尚卓; 姜卓; 張青; 劉占魁; 田冬 申請(專利權(quán))人 昆山中創(chuàng)軟件工程有限責(zé)任公司
代理機構(gòu) 北京集佳知識產(chǎn)權(quán)代理有限公司 代理人 山東中創(chuàng)軟件工程股份有限公司; 昆山中創(chuàng)軟件工程有限責(zé)任公司
地址 250013 山東省濟南市歷下區(qū)千佛山東路41-1號
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種信息爬取方法、裝置、設(shè)備及計算機可讀存儲介質(zhì),該方法包括:從服務(wù)器后臺獲取需要查詢的信息對應(yīng)的信息要素;將所述信息要素填充到目標(biāo)網(wǎng)頁的搜索框內(nèi),并觸發(fā)所述目標(biāo)網(wǎng)頁彈出驗證碼;從所述目標(biāo)網(wǎng)頁對應(yīng)瀏覽器獲取外界人員進行驗證碼對應(yīng)驗證得到的驗證信息,如果所述驗證信息表示驗證通過,則將所述驗證信息返回給所述服務(wù)器后臺,以指示所述服務(wù)器后臺運行的爬蟲程序進行需查詢的信息的爬取。可見,對于具有驗證碼的網(wǎng)站,本申請自動實現(xiàn)信息搜索及信息爬取等步驟,僅僅需要人工參與驗證碼對應(yīng)驗證,從而實現(xiàn)人工最小化干預(yù),實現(xiàn)了半自動化的信息爬取方式,從而大大提高了信息獲取速度。