一種用戶上網(wǎng)偏好數(shù)據(jù)識(shí)別方法

基本信息

申請(qǐng)?zhí)?/td> CN201410664717.6 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN104462245B 公開(kāi)(公告)日 2017-09-05
申請(qǐng)公布號(hào) CN104462245B 申請(qǐng)公布日 2017-09-05
分類號(hào) G06F17/30(2006.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 劉雷;馮先宏 申請(qǐng)(專利權(quán))人 南京亞信軟件有限公司
代理機(jī)構(gòu) 南京天翼專利代理有限責(zé)任公司 代理人 南京亞信軟件有限公司
地址 210013 江蘇省南京市雨花臺(tái)區(qū)軟件大道180號(hào)02棟201
法律狀態(tài) -

摘要

摘要 本發(fā)明公開(kāi)一種用戶上網(wǎng)偏好數(shù)據(jù)識(shí)別方法,通過(guò)利用現(xiàn)有的中位數(shù)概念、H?index算法,根據(jù)用戶的上網(wǎng)行為特征,對(duì)用戶的偏好進(jìn)行偏好、偏好度識(shí)別,提高數(shù)據(jù)識(shí)別的準(zhǔn)確度和識(shí)別效率。方法首先將獲取到的用戶上網(wǎng)行為日志數(shù)據(jù)根據(jù)不同應(yīng)用進(jìn)行分別匯總,然后指定各應(yīng)用的指標(biāo)類型,并取出各指標(biāo)的最大值和最小值,再通過(guò)偏好挖掘算法根據(jù)最大值與最小值算出變異系數(shù),然后分別對(duì)各不同應(yīng)用的不同指標(biāo)值進(jìn)行標(biāo)準(zhǔn)化指標(biāo)值,根據(jù)標(biāo)準(zhǔn)化的值計(jì)算各不同應(yīng)用偏好度,根據(jù)偏好度數(shù)值高低對(duì)各應(yīng)用進(jìn)行排序,從排序后的各應(yīng)用中選取偏好度居中的應(yīng)用偏好度作為中位數(shù);將偏好度大于中位數(shù)的應(yīng)用添加至偏好度排名中,最后根據(jù)H?index算法給用戶打上偏好度標(biāo)簽。