一種基于大數(shù)據(jù)平臺(tái)的網(wǎng)絡(luò)信息采集方法

基本信息

申請(qǐng)?zhí)?/td> CN201910913561.3 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN110691081A 公開(kāi)(公告)日 2020-01-14
申請(qǐng)公布號(hào) CN110691081A 申請(qǐng)公布日 2020-01-14
分類(lèi)號(hào) H04L29/06 分類(lèi) 電通信技術(shù);
發(fā)明人 韓冰;陳曉峰 申請(qǐng)(專(zhuān)利權(quán))人 南京源堡科技研究院有限公司
代理機(jī)構(gòu) 南京眾聯(lián)專(zhuān)利代理有限公司 代理人 周新亞
地址 210049 江蘇省南京市棲霞區(qū)馬群街道紫東路2號(hào)C4幢401室
法律狀態(tài) -

摘要

摘要 本發(fā)明公開(kāi)了一種基于大數(shù)據(jù)平臺(tái)的網(wǎng)絡(luò)信息采集方法,包括以下步驟:步驟1:按照一定的周期對(duì)網(wǎng)絡(luò)信息進(jìn)行采集,針對(duì)采集的安全信息進(jìn)行分類(lèi)處理,替提取URL,即資源類(lèi)型、存放資源的主機(jī)域名、資源文件名;步驟2:將步驟1中提取的信息傳送至管理數(shù)據(jù)庫(kù)進(jìn)行二次處理,分別將相關(guān)數(shù)據(jù)和預(yù)設(shè)閾值進(jìn)行對(duì)比,如果浮動(dòng)范圍控制再0—15%范圍內(nèi),該數(shù)據(jù)為可用數(shù)據(jù);如果浮動(dòng)范圍超過(guò)15%,則認(rèn)為該數(shù)據(jù)不可用,作丟棄處理;步驟3:對(duì)步驟2中的可用數(shù)據(jù)進(jìn)行分類(lèi)保存,便于隨時(shí)調(diào)度;步驟4:針對(duì)步驟3中分類(lèi)后的數(shù)據(jù)進(jìn)行調(diào)度處理,針對(duì)不同的控制端口輸出不同類(lèi)型的數(shù)據(jù)信息。該方法可以有針對(duì)性的采集關(guān)鍵的數(shù)據(jù)進(jìn)行分析處理,為安全分析提供更有針對(duì)性的參考數(shù)據(jù),確保網(wǎng)絡(luò)安全分析的準(zhǔn)確性。