一種基于大數(shù)據(jù)的網(wǎng)頁資產(chǎn)指紋標(biāo)簽識(shí)別與發(fā)現(xiàn)方法

基本信息

申請?zhí)?/td> CN202110611576.1 申請日 -
公開(公告)號 CN113259467A 公開(公告)日 2021-08-13
申請公布號 CN113259467A 申請公布日 2021-08-13
分類號 H04L29/08(2006.01)I;H04L12/26(2006.01)I;G06F16/182(2019.01)I;G06F16/23(2019.01)I;G06F16/2458(2019.01)I 分類 電通信技術(shù);
發(fā)明人 武斐;管越;虞雁群;吳艷;單易;劉彥伸;郭銀鋒 申請(專利權(quán))人 浙江御安信息技術(shù)有限公司
代理機(jī)構(gòu) 杭州中港知識(shí)產(chǎn)權(quán)代理有限公司 代理人 施建勇
地址 310000浙江省杭州市拱墅區(qū)石祥路242號2幢403室
法律狀態(tài) -

摘要

摘要 一種基于大數(shù)據(jù)的網(wǎng)頁資產(chǎn)指紋標(biāo)簽識(shí)別與發(fā)現(xiàn)方法,屬于數(shù)據(jù)信息傳輸技術(shù)領(lǐng)域,包括以下步驟:步驟S1,選擇一個(gè)要掃描的目標(biāo)IP;步驟S2,對目標(biāo)IP進(jìn)行掃描,確保目標(biāo)IP存活;步驟S3,解析資產(chǎn)詳情;步驟S4,解析網(wǎng)頁資產(chǎn);步驟S5,將步驟S3中的資產(chǎn)詳情和步驟S4中的網(wǎng)頁資產(chǎn)合并整理成資產(chǎn)數(shù)據(jù)集,并將資產(chǎn)數(shù)據(jù)集均存儲(chǔ)在MySQL中和ElasticSearch中;步驟S6,通過Flume將ElasticSearch中存儲(chǔ)的網(wǎng)頁資產(chǎn)傳輸?shù)紿DFS中;步驟S7,利用Hive對Flume提取到HDFS的數(shù)據(jù)進(jìn)行分析計(jì)算;步驟S8,將定義為新指紋標(biāo)簽的數(shù)據(jù)追加到MongoDB指紋標(biāo)簽庫中。本方案考慮結(jié)合大數(shù)據(jù)技術(shù)對大量的資產(chǎn)數(shù)據(jù)進(jìn)行梳理剖析,補(bǔ)充現(xiàn)有的資產(chǎn)指紋標(biāo)簽庫,幫助企業(yè)和組織更全面更及時(shí)的對網(wǎng)頁資產(chǎn)進(jìn)行識(shí)別與管理。