泛濫子域的識別方法和系統(tǒng)

基本信息

申請?zhí)?/td> CN201210256109.2 申請日 -
公開(公告)號 CN103581347B 公開(公告)日 2019-03-26
申請公布號 CN103581347B 申請公布日 2019-03-26
分類號 H04L29/12(2006.01)I 分類 電通信技術(shù);
發(fā)明人 李學(xué)凱; 張鋒 申請(專利權(quán))人 深圳市世紀(jì)光速信息技術(shù)有限公司
代理機(jī)構(gòu) 北京華沛德權(quán)律師事務(wù)所 代理人 劉杰
地址 518057 廣東省深圳市南山區(qū)粵海街道科技中一路騰訊大廈16層
法律狀態(tài) -

摘要

摘要 本發(fā)明實(shí)施例公開了一種泛濫子域的識別方法和系統(tǒng),涉及計(jì)算機(jī)技術(shù)領(lǐng)域,應(yīng)用于搜索引擎,根據(jù)子域名的任一有效片段組的片段長度的離散度或集中度來識別泛濫子域,可有效提高泛濫子域識別程度。本發(fā)明實(shí)施例提供的方法包括:收集具有相同主域名的子域名;若判斷所述具有相同主域名的子域名的任一有效片段組的片段長度為離散分布或集中分布,則將所述任一有效片段組對應(yīng)的子域名識別為泛濫子域,其中,所述有效片段組為:在所述具有相同主域名的子域名的同一級片段中,所述同一級片段的左側(cè)域名部分和右側(cè)域名部分分別相同的片段集合。