無類型標簽用戶數(shù)據(jù)的處理方法、裝置、電子設(shè)備和介質(zhì)

基本信息

申請?zhí)?/td> CN202210308309.1 申請日 -
公開(公告)號 CN114418752A 公開(公告)日 2022-04-29
申請公布號 CN114418752A 申請公布日 2022-04-29
分類號 G06Q40/02(2012.01)I;G06Q40/04(2012.01)I;G06K9/62(2022.01)I;G06N3/08(2006.01)I 分類 計算;推算;計數(shù);
發(fā)明人 郭翊麟;孫悅;蔡準;郭曉鵬 申請(專利權(quán))人 北京芯盾時代科技有限公司
代理機構(gòu) 北京樂知新創(chuàng)知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 周偉
地址 102300北京市門頭溝區(qū)蓮石湖西路98號院5號樓2201室
法律狀態(tài) -

摘要

摘要 本公開提供了一種無類型標簽用戶數(shù)據(jù)的處理方法、裝置、設(shè)備及存儲介質(zhì),包括:根據(jù)用戶的交易特征數(shù)據(jù)對用戶進行聚類,得到特定數(shù)量的簇;確定簇為包含無類型標簽用戶的無類型標簽簇或不包含無類型標簽用戶的有類型標簽簇;類型標簽用于指示用戶異?;蛘#贿x取特定數(shù)量的無類型標簽簇作為樣本簇;從樣本簇中選取相似度最大的特定數(shù)量的第一用戶,根據(jù)被選取的第一用戶構(gòu)建正樣本對;選取相似度滿足設(shè)定條件的兩個樣本簇,分別從該兩個樣本簇選取第一用戶,根據(jù)被選取的第一用戶構(gòu)建負樣本對;為正樣本對配置相似的相似度標簽,為負樣本對配置不相似的相似度標簽;將具有相似度標簽的正樣本對和負樣本對構(gòu)建為無類型標簽樣本集合。