一種用戶上網(wǎng)偏好數(shù)據(jù)識(shí)別方法
基本信息
申請(qǐng)?zhí)?/td> | CN201410664717.6 | 申請(qǐng)日 | - |
公開(kāi)(公告)號(hào) | CN104462245B | 公開(kāi)(公告)日 | 2017-09-05 |
申請(qǐng)公布號(hào) | CN104462245B | 申請(qǐng)公布日 | 2017-09-05 |
分類號(hào) | G06F17/30(2006.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 劉雷;馮先宏 | 申請(qǐng)(專利權(quán))人 | 南京亞信軟件有限公司 |
代理機(jī)構(gòu) | 南京天翼專利代理有限責(zé)任公司 | 代理人 | 南京亞信軟件有限公司 |
地址 | 210013 江蘇省南京市雨花臺(tái)區(qū)軟件大道180號(hào)02棟201 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開(kāi)一種用戶上網(wǎng)偏好數(shù)據(jù)識(shí)別方法,通過(guò)利用現(xiàn)有的中位數(shù)概念、H?index算法,根據(jù)用戶的上網(wǎng)行為特征,對(duì)用戶的偏好進(jìn)行偏好、偏好度識(shí)別,提高數(shù)據(jù)識(shí)別的準(zhǔn)確度和識(shí)別效率。方法首先將獲取到的用戶上網(wǎng)行為日志數(shù)據(jù)根據(jù)不同應(yīng)用進(jìn)行分別匯總,然后指定各應(yīng)用的指標(biāo)類型,并取出各指標(biāo)的最大值和最小值,再通過(guò)偏好挖掘算法根據(jù)最大值與最小值算出變異系數(shù),然后分別對(duì)各不同應(yīng)用的不同指標(biāo)值進(jìn)行標(biāo)準(zhǔn)化指標(biāo)值,根據(jù)標(biāo)準(zhǔn)化的值計(jì)算各不同應(yīng)用偏好度,根據(jù)偏好度數(shù)值高低對(duì)各應(yīng)用進(jìn)行排序,從排序后的各應(yīng)用中選取偏好度居中的應(yīng)用偏好度作為中位數(shù);將偏好度大于中位數(shù)的應(yīng)用添加至偏好度排名中,最后根據(jù)H?index算法給用戶打上偏好度標(biāo)簽。 |
