基于BiRNN深度學(xué)習(xí)的DGA域名檢測(cè)方法

基本信息

申請(qǐng)?zhí)?/td> CN201910904014.9 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN110807098A 公開(kāi)(公告)日 2020-02-18
申請(qǐng)公布號(hào) CN110807098A 申請(qǐng)公布日 2020-02-18
分類號(hào) G06F16/35;G06K9/62;G06N3/04;G06N3/08;H04L29/06 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 袁明 申請(qǐng)(專利權(quán))人 武漢智美互聯(lián)科技有限公司
代理機(jī)構(gòu) 北京匯信合知識(shí)產(chǎn)權(quán)代理有限公司 代理人 王維新
地址 430000 湖北省武漢市東湖新技術(shù)開(kāi)發(fā)區(qū)光谷大道77號(hào)金融后臺(tái)服務(wù)中心基地建設(shè)項(xiàng)目二期B17棟11層01室-7
法律狀態(tài) -

摘要

摘要 本發(fā)明公開(kāi)了一種基于BiRNN深度學(xué)習(xí)的DGA域名檢測(cè)方法,包括:對(duì)域名數(shù)據(jù)進(jìn)行清洗,保留有效域名數(shù)據(jù);將有效域名數(shù)據(jù)預(yù)處理為統(tǒng)一長(zhǎng)度的一維向量;建立基于BiRNN的深度學(xué)習(xí)分類模型,將域名的字符轉(zhuǎn)化為詞向量,并輸入BiRNN神經(jīng)網(wǎng)絡(luò)以提取域名的文本特征,利用全連接網(wǎng)絡(luò)分類器進(jìn)行分類;根據(jù)正常域名數(shù)據(jù)和DGA域名數(shù)據(jù)對(duì)應(yīng)的分類結(jié)果訓(xùn)練深度學(xué)習(xí)分類模型;將新域名清洗和預(yù)處理后導(dǎo)入深度學(xué)習(xí)分類模型,判斷新域名是正常域名或DGA域名。通過(guò)本發(fā)明的技術(shù)方案,無(wú)需大量特征工程,識(shí)別準(zhǔn)確率達(dá)95%以上,整個(gè)過(guò)程是一個(gè)完整連續(xù)流程,實(shí)現(xiàn)了從輸入原始域名到最終識(shí)別結(jié)果的端到端的檢測(cè),極大的提高了檢測(cè)效率和檢查準(zhǔn)確度。