基于深度學(xué)習(xí)和半監(jiān)督學(xué)習(xí)的webshell檢測方法及裝置

基本信息

申請?zhí)?/td> CN201810623283.3 申請日 -
公開(公告)號 CN108833409B 公開(公告)日 2021-03-16
申請公布號 CN108833409B 申請公布日 2021-03-16
分類號 G06F21/57(2013.01)I;H04L29/06(2006.01)I;G06N3/08(2006.01)I 分類 電通信技術(shù);
發(fā)明人 吳斌;趙力;朱和穩(wěn);韓傳富 申請(專利權(quán))人 北京網(wǎng)思科平科技有限公司
代理機構(gòu) 北京知呱呱知識產(chǎn)權(quán)代理有限公司 代理人 呂學(xué)文;武媛
地址 100086北京市海淀區(qū)馬連洼北路125號億城國際中心525
法律狀態(tài) -

摘要

摘要 基于深度學(xué)習(xí)和半監(jiān)督學(xué)習(xí)的webshell檢測方法及裝置,獲取原始的訓(xùn)練樣本,選取有標(biāo)記樣本進行分詞處理,通過卡方檢驗分析特征詞與標(biāo)簽之間的相關(guān)性,選擇相關(guān)性最強的前K個特征詞作為篩選特征詞;采用篩選特征詞對未標(biāo)記樣本進行特征詞篩選,作為未標(biāo)記樣本特征;對獲取的未標(biāo)記樣本特征使用神經(jīng)網(wǎng)絡(luò)算法訓(xùn)練,獲得各個未標(biāo)記樣本的文本向量;使用無監(jiān)督方法訓(xùn)練單分類SVDD模型,優(yōu)化超球面半徑最小化,最大情況包含未標(biāo)記樣本;對于新的標(biāo)記樣本,運用在線學(xué)習(xí)方式增量訓(xùn)練SVDD模型,修正單分類SVDD模型;將最新模型用于新樣本的預(yù)測。本發(fā)明能夠有效改善傳統(tǒng)webshell檢測的漏報率和誤報率。??