一種基于少量標注數(shù)據(jù)的網(wǎng)絡(luò)流量異常檢測方法

基本信息

申請?zhí)?/td> CN202010344517.8 申請日 -
公開(公告)號 CN111585997B 公開(公告)日 2022-01-14
申請公布號 CN111585997B 申請公布日 2022-01-14
分類號 H04L9/40(2022.01)I;G06K9/62(2006.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I 分類 電通信技術(shù);
發(fā)明人 李文龍;張家琦;邢燕禎;劉中金;何躍鷹;高楊;王新根;魯萍;黃滔 申請(專利權(quán))人 浙江邦盛科技股份有限公司
代理機構(gòu) 杭州求是專利事務(wù)所有限公司 代理人 劉靜
地址 100029北京市朝陽區(qū)裕民路甲3號
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種基于少量標注數(shù)據(jù)的網(wǎng)絡(luò)流量異常檢測方法,采用雙自編碼器對特征向量進行降維處理,然后使用深度神經(jīng)網(wǎng)絡(luò)進行有監(jiān)督的訓(xùn)練;將網(wǎng)絡(luò)流量分成正樣本和負樣本的兩類,最后篩選出無標注數(shù)據(jù)中部分重要樣本,交由專家進行標注,增加有標記樣本數(shù)量,迭代更新自編碼器和分類器,之后用訓(xùn)練好的分類器進行網(wǎng)絡(luò)流量異常檢測。本發(fā)明提出雙自編碼器架構(gòu),使用純凈的正負樣本分別訓(xùn)練自編碼器,提升了分類器的穩(wěn)定性。同時改進深度神經(jīng)網(wǎng)絡(luò)的損失函數(shù),更細粒度地調(diào)整樣本權(quán)重,解決正負樣本不平衡,緩解訓(xùn)練集較小導(dǎo)致的過擬合問題,并提出一種新的計算無標注數(shù)據(jù)的標記價值的方法,選擇標記價值高的樣本交由專家,減少了標注成本。