一種聚類方法及裝置

基本信息

申請?zhí)?/td> CN201110041200.8 申請日 -
公開(公告)號 CN102646097B 公開(公告)日 2019-04-26
申請公布號 CN102646097B 申請公布日 2019-04-26
分類號 G06F16/906(2019.01)I 分類 計算;推算;計數(shù);
發(fā)明人 陳建群; 楊志峰; 劉建; 賀鵬程; 崔巖; 肖戰(zhàn)勇 申請(專利權(quán))人 騰訊音樂(北京)有限公司
代理機構(gòu) 廣州三環(huán)專利商標(biāo)代理有限公司 代理人 騰訊科技(深圳)有限公司;騰訊云計算(北京)有限責(zé)任公司
地址 518028 廣東省深圳市福田區(qū)賽格科技園2棟東403室
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種聚類方法及裝置,其中,一種聚類方法包括:通過MinHash聚類模型為多個用戶劃分類別,存儲所述MinHash聚類模型的哈希函數(shù),以及存儲所述多個用戶的哈希值與所述類別的對應(yīng)關(guān)系;通過所述MinHash聚類模型的哈希函數(shù)確定新用戶的哈希值;根據(jù)所述哈希值與所述類別的對應(yīng)關(guān)系,確定所述新用戶的哈希值對應(yīng)的類別。通過確定MinHash聚類模型的哈希函數(shù)以及哈希值與類別的對應(yīng)關(guān)系,實現(xiàn)利用已有的MinHash聚類模型將新用戶快速重聚類,不再需要重新生成聚類模型,提高對新用戶的聚類效率。