基于嵌入向量的用戶標(biāo)簽提取方法、裝置及電子設(shè)備

基本信息

申請?zhí)?/td> CN202210113158.4 申請日 -
公開(公告)號 CN114139063B 公開(公告)日 2022-05-17
申請公布號 CN114139063B 申請公布日 2022-05-17
分類號 G06F16/9535(2019.01)I;G06F16/958(2019.01)I;G06F16/2458(2019.01)I;G06K9/62(2022.01)I 分類 計算;推算;計數(shù);
發(fā)明人 劉平安;田昊宇 申請(專利權(quán))人 北京淇瑀信息科技有限公司
代理機(jī)構(gòu) 北京清誠知識產(chǎn)權(quán)代理有限公司 代理人 -
地址 100012北京市朝陽區(qū)雙營路11號院3號樓2層4單元207
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種基于嵌入向量的用戶標(biāo)簽提取方法、裝置及電子設(shè)備,所述方法包括:經(jīng)全量用戶授權(quán)后獲取全量用戶設(shè)備數(shù)據(jù)的嵌入向量,生成訓(xùn)練數(shù)據(jù);通過所述訓(xùn)練數(shù)據(jù)和多個候選聚類中心數(shù)訓(xùn)練對應(yīng)的多個候選聚類模型;根據(jù)包含正負(fù)樣本的調(diào)優(yōu)數(shù)據(jù)對所述候選聚類模型進(jìn)行調(diào)優(yōu)處理,得到最優(yōu)聚類模型;基于所述最優(yōu)聚類模型對用戶進(jìn)行聚類,提取用戶標(biāo)簽。本發(fā)明的最優(yōu)聚類模型能夠在嵌入向量之上做一層語義聚類,從而利用用戶之間的向量距離,充分挖掘用戶之間存在的語義相似性,對用戶進(jìn)行聚類,保證提取用戶標(biāo)簽的準(zhǔn)確性,從而避免對用戶價值、意愿和風(fēng)險的誤判,尤其是對用戶風(fēng)險的誤判,提高業(yè)務(wù)安全性。