基于機(jī)器學(xué)習(xí)的釣魚網(wǎng)站URL檢測(cè)方法及系統(tǒng)
基本信息
申請(qǐng)?zhí)?/td> | CN202110231656.4 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN112948725A | 公開(公告)日 | 2021-06-11 |
申請(qǐng)公布號(hào) | CN112948725A | 申請(qǐng)公布日 | 2021-06-11 |
分類號(hào) | G06F16/955;G06N20/00 | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 于金龍;王智民;王高杰;卯路寧 | 申請(qǐng)(專利權(quán))人 | 北京六方云信息技術(shù)有限公司 |
代理機(jī)構(gòu) | 北京潤(rùn)平知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | 肖冰濱;王曉曉 |
地址 | 100085 北京市海淀區(qū)上地信息路12號(hào)1幢2層C202室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明提供一種基于機(jī)器學(xué)習(xí)的釣魚網(wǎng)站URL檢測(cè)方法及系統(tǒng),屬于信息安全領(lǐng)域。所述方法包括:對(duì)待測(cè)URL進(jìn)行解析,提取待測(cè)URL的結(jié)構(gòu)信息和組成待測(cè)URL的單詞;根據(jù)所述待測(cè)URL、所述待測(cè)URL的結(jié)構(gòu)信息和組成待測(cè)URL的單詞提取URL特征;將所述URL特征輸入訓(xùn)練好的URL檢測(cè)模型進(jìn)行檢測(cè),得到待測(cè)URL為異常URL的概率。與傳統(tǒng)的黑名單技術(shù)相比,本發(fā)明的URL檢測(cè)方法從URL中提取特征訓(xùn)練模型進(jìn)行預(yù)測(cè),覆蓋范圍更廣,檢測(cè)結(jié)果更加準(zhǔn)確,采用訓(xùn)練好的URL模型進(jìn)行檢測(cè),不需要頻繁進(jìn)行更新,且占用資源較少,普通計(jì)算機(jī)也能夠運(yùn)行,滿足廣大用戶的需求。 |
