一種面向大數(shù)據中任意形狀數(shù)據簇的快速聚類方法
基本信息
申請?zhí)?/td> | CN201710059010.6 | 申請日 | - |
公開(公告)號 | CN106844692A | 公開(公告)日 | 2017-06-13 |
申請公布號 | CN106844692A | 申請公布日 | 2017-06-13 |
分類號 | G06F17/30(2006.01)I | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 李宗鵬;黃浩 | 申請(專利權)人 | 武漢萬般上品信息技術有限公司 |
代理機構 | 武漢科皓知識產權代理事務所(特殊普通合伙) | 代理人 | 武漢萬般上品信息技術有限公司 |
地址 | 430070 湖北省武漢市東湖新技術開發(fā)區(qū)光谷大道303號光谷芯中心2-07棟201-03室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種面向大數(shù)據中任意形狀數(shù)據簇的快速聚類方法;通過對海量數(shù)據進行采樣,并且對采樣點的位置根據原始數(shù)據分布進行合理調整,實現(xiàn)在壓縮數(shù)據集中數(shù)據樣本數(shù)量的同時,能夠有效保留原始數(shù)據集的形狀信息。接下來在數(shù)據集上使用現(xiàn)有的任意形狀聚類算法進行處理,得到最終的聚類結果。本發(fā)明能夠使得在采樣數(shù)據集上的聚類結果與在原始數(shù)據集上的聚類結果基本一致。相較于現(xiàn)有的對大數(shù)據的任意形狀處理方法,本發(fā)明的方法能夠在保持結果準確的前提下,極大的壓縮方法的運行時間,因而比現(xiàn)有方法更加高效。 |
