一種基于機器學(xué)習(xí)的跨站腳本攻擊識別方法

基本信息

申請?zhí)?/td> CN202111195689.4 申請日 -
公開(公告)號 CN114124448A 公開(公告)日 2022-03-01
申請公布號 CN114124448A 申請公布日 2022-03-01
分類號 H04L9/40(2022.01)I;G06K9/62(2022.01)I 分類 電通信技術(shù);
發(fā)明人 劉兵;謝鑫;何召陽;任玉坤;何曉剛;郗朝旭 申請(專利權(quán))人 北京墨云科技有限公司
代理機構(gòu) 北京巨弘知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 趙洋
地址 100085北京市海淀區(qū)上地信息路12號1幢4層C401
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種基于機器學(xué)習(xí)的跨站腳本攻擊識別方法,包括以下步驟:S1、網(wǎng)頁數(shù)據(jù)收集:搭建含有跨站腳本攻擊漏洞的靶場,使用掃描器和人工滲透的方式收集含有跨站腳本攻擊的相關(guān)數(shù)據(jù),對相關(guān)數(shù)據(jù)進行分類標(biāo)注;S2、數(shù)據(jù)特征工程:對相關(guān)數(shù)據(jù)進行數(shù)據(jù)清洗;S3、數(shù)據(jù)特征化分析:將跨站腳本攻擊語句視為文本信息,進行文本特征抽取,生成分詞信息;S4、機器學(xué)習(xí):將分詞信息通過XGBoost集成算法模型進行訓(xùn)練,得到用于跨站腳本攻擊識別的分類器模型;S5、跨站腳本攻擊識別:將Web請求數(shù)據(jù)經(jīng)過特征工程及向量化處理后進入分類器模型進行預(yù)測,識別跨站腳本攻擊。本發(fā)明能夠有效提高跨站腳本攻擊識別效率,提高安全性。