基于機(jī)器學(xué)習(xí)的釣魚網(wǎng)站URL檢測(cè)方法及系統(tǒng)

基本信息

申請(qǐng)?zhí)?/td> CN202110231656.4 申請(qǐng)日 -
公開(公告)號(hào) CN112948725A 公開(公告)日 2021-06-11
申請(qǐng)公布號(hào) CN112948725A 申請(qǐng)公布日 2021-06-11
分類號(hào) G06F16/955;G06N20/00 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 于金龍;王智民;王高杰;卯路寧 申請(qǐng)(專利權(quán))人 北京六方云信息技術(shù)有限公司
代理機(jī)構(gòu) 北京潤(rùn)平知識(shí)產(chǎn)權(quán)代理有限公司 代理人 肖冰濱;王曉曉
地址 100085 北京市海淀區(qū)上地信息路12號(hào)1幢2層C202室
法律狀態(tài) -

摘要

摘要 本發(fā)明提供一種基于機(jī)器學(xué)習(xí)的釣魚網(wǎng)站URL檢測(cè)方法及系統(tǒng),屬于信息安全領(lǐng)域。所述方法包括:對(duì)待測(cè)URL進(jìn)行解析,提取待測(cè)URL的結(jié)構(gòu)信息和組成待測(cè)URL的單詞;根據(jù)所述待測(cè)URL、所述待測(cè)URL的結(jié)構(gòu)信息和組成待測(cè)URL的單詞提取URL特征;將所述URL特征輸入訓(xùn)練好的URL檢測(cè)模型進(jìn)行檢測(cè),得到待測(cè)URL為異常URL的概率。與傳統(tǒng)的黑名單技術(shù)相比,本發(fā)明的URL檢測(cè)方法從URL中提取特征訓(xùn)練模型進(jìn)行預(yù)測(cè),覆蓋范圍更廣,檢測(cè)結(jié)果更加準(zhǔn)確,采用訓(xùn)練好的URL模型進(jìn)行檢測(cè),不需要頻繁進(jìn)行更新,且占用資源較少,普通計(jì)算機(jī)也能夠運(yùn)行,滿足廣大用戶的需求。