標(biāo)記樣本的方法、系統(tǒng)、設(shè)備及介質(zhì)
基本信息
申請(qǐng)?zhí)?/td> | CN201911158382.X | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN112839010A | 公開(公告)日 | 2021-05-25 |
申請(qǐng)公布號(hào) | CN112839010A | 申請(qǐng)公布日 | 2021-05-25 |
分類號(hào) | H04L29/06;G06N20/00;H04L29/08 | 分類 | 電通信技術(shù); |
發(fā)明人 | 潘廷珅;叢磊 | 申請(qǐng)(專利權(quán))人 | 北京數(shù)安鑫云信息技術(shù)有限公司 |
代理機(jī)構(gòu) | 北京名華博信知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | 苗源 |
地址 | 100015 北京市朝陽區(qū)酒仙橋北路甲10號(hào)院201號(hào)樓5層505內(nèi)02 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種標(biāo)記樣本的方法、系統(tǒng)、設(shè)備及介質(zhì),方法包括:獲取每個(gè)url_pattern在第一預(yù)設(shè)時(shí)間段內(nèi)的頁面瀏覽量,以及訪問該url_pattern的去重后的IP地址數(shù)量,以確定危險(xiǎn)url_pattern;獲取第二預(yù)設(shè)時(shí)間段內(nèi)訪問每一個(gè)危險(xiǎn)url_pattern的IP地址的時(shí)間參數(shù)和頁面瀏覽參數(shù),進(jìn)而確定出現(xiàn)異常訪問的IP地址,將出現(xiàn)異常訪問的IP地址標(biāo)記為正樣本。使用本發(fā)明中的方法標(biāo)記正樣本,不僅標(biāo)記準(zhǔn)確性高、減少人力成本,而且標(biāo)記效率高、通用性好,以便給機(jī)器學(xué)習(xí)模型中篩選正樣本數(shù)據(jù)。 |
