一種用戶實(shí)際訪問網(wǎng)址的識別方法及裝置

基本信息

申請?zhí)?/td> CN202010467463.4 申請日 -
公開(公告)號 CN111611508B 公開(公告)日 2020-12-15
申請公布號 CN111611508B 申請公布日 2020-12-15
分類號 G06F16/955 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 翟欣虎;秦益飛;楊正權(quán) 申請(專利權(quán))人 江蘇易安聯(lián)網(wǎng)絡(luò)技術(shù)有限公司
代理機(jī)構(gòu) 無錫市匯誠永信專利代理事務(wù)所(普通合伙) 代理人 江蘇易安聯(lián)網(wǎng)絡(luò)技術(shù)有限公司
地址 211100 江蘇省南京市江寧區(qū)秣陵街道秣周東路12號悠谷孵化器4樓401室
法律狀態(tài) -

摘要

摘要 本發(fā)明提供了一種用戶實(shí)際訪問網(wǎng)址的識別方法,包括如下步驟:S01、收集服務(wù)器上產(chǎn)生的用戶日志;S02、按第一特征進(jìn)行分組;S03、將每一組的用戶日志按第二特征進(jìn)行排序;S04、將已經(jīng)排好序的每一組用戶日志,按第一合并規(guī)則合并為若干小組,每一小組內(nèi)的用戶日志歸并為該用戶一次訪問所產(chǎn)生的請求日志;S05、對于已經(jīng)分好的一次訪問產(chǎn)生的若干條請求日志,按第二規(guī)則構(gòu)建多叉樹,遍歷這些請求日志,構(gòu)建出一棵或者多棵多叉樹;S06、統(tǒng)計(jì)上述一棵或者多棵多叉樹的葉子節(jié)點(diǎn)的數(shù)量,選出其中葉子節(jié)點(diǎn)最多的樹的根節(jié)點(diǎn)作為該用戶當(dāng)時(shí)實(shí)際訪問的網(wǎng)站地址;S07、重復(fù)上述步驟,即可識別出用戶實(shí)際訪問的網(wǎng)址。該發(fā)明具有準(zhǔn)確性高、實(shí)時(shí)性高的優(yōu)點(diǎn)。