一種網(wǎng)站識(shí)別方法及識(shí)別系統(tǒng)
基本信息
申請(qǐng)?zhí)?/td> | CN201810696532.1 | 申請(qǐng)日 | - |
公開(kāi)(公告)號(hào) | CN108875060B | 公開(kāi)(公告)日 | 2021-02-26 |
申請(qǐng)公布號(hào) | CN108875060B | 申請(qǐng)公布日 | 2021-02-26 |
分類號(hào) | G06F16/9535(2019.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 余剛 | 申請(qǐng)(專利權(quán))人 | 成都映潮科技股份有限公司 |
代理機(jī)構(gòu) | 成都創(chuàng)新引擎知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | 向群 |
地址 | 610041 四川省成都市高新區(qū)天府大道中段666號(hào)2棟34層3406號(hào) | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明提供了一種網(wǎng)站識(shí)別方法及識(shí)別系統(tǒng),該方法包括:采集至少三個(gè)樣本網(wǎng)頁(yè)分別對(duì)應(yīng)的至少三個(gè)樣本網(wǎng)址和至少三個(gè)樣本源代碼;根據(jù)預(yù)設(shè)的至少兩個(gè)特征類型,從每一個(gè)所述樣本源代碼中解析出每一個(gè)所述特征類型對(duì)應(yīng)的特征值;根據(jù)解析出的每一個(gè)所述樣本源代碼對(duì)應(yīng)的各個(gè)所述特征值,構(gòu)建所述至少三個(gè)樣本網(wǎng)址對(duì)應(yīng)的隨機(jī)森林模型;還包括:獲取待識(shí)別網(wǎng)站網(wǎng)址;利用所述隨機(jī)森林模型確定所述待識(shí)別網(wǎng)站網(wǎng)址的網(wǎng)站類型。本方案能提高識(shí)別網(wǎng)站類型的準(zhǔn)確度。?? |
