用戶群體的分類方法、裝置、存儲(chǔ)介質(zhì)及計(jì)算機(jī)設(shè)備
基本信息
申請(qǐng)?zhí)?/td> | CN202111412279.0 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN113836370B | 公開(公告)日 | 2022-03-01 |
申請(qǐng)公布號(hào) | CN113836370B | 申請(qǐng)公布日 | 2022-03-01 |
分類號(hào) | G06F16/9035(2019.01)I;G06F16/906(2019.01)I;G06N20/00(2019.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 陶景龍;王啟凡;魏國(guó)富;殷錢安;余賢喆;周曉勇;梁淑云;劉勝;馬影 | 申請(qǐng)(專利權(quán))人 | 上海觀安信息技術(shù)股份有限公司 |
代理機(jī)構(gòu) | 北京中強(qiáng)智尚知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | 黃耀威 |
地址 | 200000上海市浦東新區(qū)泥城鎮(zhèn)云端路1412弄15號(hào)二層1室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種用戶群體的分類方法、裝置、存儲(chǔ)介質(zhì)及計(jì)算機(jī)設(shè)備。其中方法包括:獲取用戶群體的行為數(shù)據(jù),并對(duì)用戶群體的行為數(shù)據(jù)進(jìn)行預(yù)處理,得到以每個(gè)用戶的用戶名為主體對(duì)象的行為序列數(shù)據(jù)集;利用關(guān)聯(lián)分析算法,對(duì)行為序列數(shù)據(jù)集中的頻繁行為指令組合進(jìn)行提取和頻次統(tǒng)計(jì),得到頻繁指令組合特征表;通過(guò)序列對(duì)比算法,計(jì)算行為序列數(shù)據(jù)集中的各個(gè)行為序列之間的序列匹配分值和序列間相似度分值,得到序列相似性特征表;對(duì)行為序列數(shù)據(jù)集中的行為指令進(jìn)行頻次統(tǒng)計(jì),得到行為指令頻次特征表;采用半監(jiān)督分類算法,對(duì)頻繁指令組合特征表、序列相似性特征表和行為指令頻次特征表進(jìn)行分類分析,得到具有不同類別的用戶群體,以提高分類效率。 |
