一種基于少量標注數(shù)據(jù)的網(wǎng)絡(luò)流量異常檢測方法
基本信息
申請?zhí)?/td> | CN202010344517.8 | 申請日 | - |
公開(公告)號 | CN111585997B | 公開(公告)日 | 2022-01-14 |
申請公布號 | CN111585997B | 申請公布日 | 2022-01-14 |
分類號 | H04L9/40(2022.01)I;G06K9/62(2006.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I | 分類 | 電通信技術(shù); |
發(fā)明人 | 李文龍;張家琦;邢燕禎;劉中金;何躍鷹;高楊;王新根;魯萍;黃滔 | 申請(專利權(quán))人 | 浙江邦盛科技股份有限公司 |
代理機構(gòu) | 杭州求是專利事務(wù)所有限公司 | 代理人 | 劉靜 |
地址 | 100029北京市朝陽區(qū)裕民路甲3號 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種基于少量標注數(shù)據(jù)的網(wǎng)絡(luò)流量異常檢測方法,采用雙自編碼器對特征向量進行降維處理,然后使用深度神經(jīng)網(wǎng)絡(luò)進行有監(jiān)督的訓(xùn)練;將網(wǎng)絡(luò)流量分成正樣本和負樣本的兩類,最后篩選出無標注數(shù)據(jù)中部分重要樣本,交由專家進行標注,增加有標記樣本數(shù)量,迭代更新自編碼器和分類器,之后用訓(xùn)練好的分類器進行網(wǎng)絡(luò)流量異常檢測。本發(fā)明提出雙自編碼器架構(gòu),使用純凈的正負樣本分別訓(xùn)練自編碼器,提升了分類器的穩(wěn)定性。同時改進深度神經(jīng)網(wǎng)絡(luò)的損失函數(shù),更細粒度地調(diào)整樣本權(quán)重,解決正負樣本不平衡,緩解訓(xùn)練集較小導(dǎo)致的過擬合問題,并提出一種新的計算無標注數(shù)據(jù)的標記價值的方法,選擇標記價值高的樣本交由專家,減少了標注成本。 |
