無類型標簽用戶數據的處理方法、裝置、電子設備和介質
基本信息
申請?zhí)?/td> | CN202210308309.1 | 申請日 | - |
公開(公告)號 | CN114418752B | 公開(公告)日 | 2022-07-12 |
申請公布號 | CN114418752B | 申請公布日 | 2022-07-12 |
分類號 | G06Q40/02(2012.01)I;G06Q40/04(2012.01)I;G06K9/62(2022.01)I;G06N3/08(2006.01)I | 分類 | 計算;推算;計數; |
發(fā)明人 | 郭翊麟;孫悅;蔡準;郭曉鵬 | 申請(專利權)人 | 北京芯盾時代科技有限公司 |
代理機構 | 北京樂知新創(chuàng)知識產權代理事務所(普通合伙) | 代理人 | - |
地址 | 102300北京市門頭溝區(qū)蓮石湖西路98號院5號樓2201室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本公開提供了一種無類型標簽用戶數據的處理方法、裝置、設備及存儲介質,包括:根據用戶的交易特征數據對用戶進行聚類,得到特定數量的簇;確定簇為包含無類型標簽用戶的無類型標簽簇或不包含無類型標簽用戶的有類型標簽簇;類型標簽用于指示用戶異?;蛘#贿x取特定數量的無類型標簽簇作為樣本簇;從樣本簇中選取相似度最大的特定數量的第一用戶,根據被選取的第一用戶構建正樣本對;選取相似度滿足設定條件的兩個樣本簇,分別從該兩個樣本簇選取第一用戶,根據被選取的第一用戶構建負樣本對;為正樣本對配置相似的相似度標簽,為負樣本對配置不相似的相似度標簽;將具有相似度標簽的正樣本對和負樣本對構建為無類型標簽樣本集合。 |
