一種聚類方法及裝置
基本信息
申請?zhí)?/td> | CN201110041200.8 | 申請日 | - |
公開(公告)號 | CN102646097B | 公開(公告)日 | 2019-04-26 |
申請公布號 | CN102646097B | 申請公布日 | 2019-04-26 |
分類號 | G06F16/906(2019.01)I | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 陳建群; 楊志峰; 劉建; 賀鵬程; 崔巖; 肖戰(zhàn)勇 | 申請(專利權(quán))人 | 騰訊音樂(北京)有限公司 |
代理機構(gòu) | 廣州三環(huán)專利商標(biāo)代理有限公司 | 代理人 | 騰訊科技(深圳)有限公司;騰訊云計算(北京)有限責(zé)任公司 |
地址 | 518028 廣東省深圳市福田區(qū)賽格科技園2棟東403室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種聚類方法及裝置,其中,一種聚類方法包括:通過MinHash聚類模型為多個用戶劃分類別,存儲所述MinHash聚類模型的哈希函數(shù),以及存儲所述多個用戶的哈希值與所述類別的對應(yīng)關(guān)系;通過所述MinHash聚類模型的哈希函數(shù)確定新用戶的哈希值;根據(jù)所述哈希值與所述類別的對應(yīng)關(guān)系,確定所述新用戶的哈希值對應(yīng)的類別。通過確定MinHash聚類模型的哈希函數(shù)以及哈希值與類別的對應(yīng)關(guān)系,實現(xiàn)利用已有的MinHash聚類模型將新用戶快速重聚類,不再需要重新生成聚類模型,提高對新用戶的聚類效率。 |
