一種面向大數(shù)據中任意形狀數(shù)據簇的快速聚類方法

基本信息

申請?zhí)?/td> CN201710059010.6 申請日 -
公開(公告)號 CN106844692A 公開(公告)日 2017-06-13
申請公布號 CN106844692A 申請公布日 2017-06-13
分類號 G06F17/30(2006.01)I 分類 計算;推算;計數(shù);
發(fā)明人 李宗鵬;黃浩 申請(專利權)人 武漢萬般上品信息技術有限公司
代理機構 武漢科皓知識產權代理事務所(特殊普通合伙) 代理人 武漢萬般上品信息技術有限公司
地址 430070 湖北省武漢市東湖新技術開發(fā)區(qū)光谷大道303號光谷芯中心2-07棟201-03室
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種面向大數(shù)據中任意形狀數(shù)據簇的快速聚類方法;通過對海量數(shù)據進行采樣,并且對采樣點的位置根據原始數(shù)據分布進行合理調整,實現(xiàn)在壓縮數(shù)據集中數(shù)據樣本數(shù)量的同時,能夠有效保留原始數(shù)據集的形狀信息。接下來在數(shù)據集上使用現(xiàn)有的任意形狀聚類算法進行處理,得到最終的聚類結果。本發(fā)明能夠使得在采樣數(shù)據集上的聚類結果與在原始數(shù)據集上的聚類結果基本一致。相較于現(xiàn)有的對大數(shù)據的任意形狀處理方法,本發(fā)明的方法能夠在保持結果準確的前提下,極大的壓縮方法的運行時間,因而比現(xiàn)有方法更加高效。