用戶群體的分類方法、裝置、存儲(chǔ)介質(zhì)及計(jì)算機(jī)設(shè)備

基本信息

申請(qǐng)?zhí)?/td> CN202111412279.0 申請(qǐng)日 -
公開(公告)號(hào) CN113836370B 公開(公告)日 2022-03-01
申請(qǐng)公布號(hào) CN113836370B 申請(qǐng)公布日 2022-03-01
分類號(hào) G06F16/9035(2019.01)I;G06F16/906(2019.01)I;G06N20/00(2019.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 陶景龍;王啟凡;魏國(guó)富;殷錢安;余賢喆;周曉勇;梁淑云;劉勝;馬影 申請(qǐng)(專利權(quán))人 上海觀安信息技術(shù)股份有限公司
代理機(jī)構(gòu) 北京中強(qiáng)智尚知識(shí)產(chǎn)權(quán)代理有限公司 代理人 黃耀威
地址 200000上海市浦東新區(qū)泥城鎮(zhèn)云端路1412弄15號(hào)二層1室
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種用戶群體的分類方法、裝置、存儲(chǔ)介質(zhì)及計(jì)算機(jī)設(shè)備。其中方法包括:獲取用戶群體的行為數(shù)據(jù),并對(duì)用戶群體的行為數(shù)據(jù)進(jìn)行預(yù)處理,得到以每個(gè)用戶的用戶名為主體對(duì)象的行為序列數(shù)據(jù)集;利用關(guān)聯(lián)分析算法,對(duì)行為序列數(shù)據(jù)集中的頻繁行為指令組合進(jìn)行提取和頻次統(tǒng)計(jì),得到頻繁指令組合特征表;通過(guò)序列對(duì)比算法,計(jì)算行為序列數(shù)據(jù)集中的各個(gè)行為序列之間的序列匹配分值和序列間相似度分值,得到序列相似性特征表;對(duì)行為序列數(shù)據(jù)集中的行為指令進(jìn)行頻次統(tǒng)計(jì),得到行為指令頻次特征表;采用半監(jiān)督分類算法,對(duì)頻繁指令組合特征表、序列相似性特征表和行為指令頻次特征表進(jìn)行分類分析,得到具有不同類別的用戶群體,以提高分類效率。