一種面向大數(shù)據(jù)中任意形狀數(shù)據(jù)簇的快速聚類方法

基本信息

申請(qǐng)?zhí)?/td> CN201710059010.6 申請(qǐng)日 -
公開(公告)號(hào) CN106844692A 公開(公告)日 2017-06-13
申請(qǐng)公布號(hào) CN106844692A 申請(qǐng)公布日 2017-06-13
分類號(hào) G06F17/30(2006.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 李宗鵬;黃浩 申請(qǐng)(專利權(quán))人 武漢萬般上品信息技術(shù)有限公司
代理機(jī)構(gòu) 武漢科皓知識(shí)產(chǎn)權(quán)代理事務(wù)所(特殊普通合伙) 代理人 武漢萬般上品信息技術(shù)有限公司
地址 430070 湖北省武漢市東湖新技術(shù)開發(fā)區(qū)光谷大道303號(hào)光谷芯中心2-07棟201-03室
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種面向大數(shù)據(jù)中任意形狀數(shù)據(jù)簇的快速聚類方法;通過對(duì)海量數(shù)據(jù)進(jìn)行采樣,并且對(duì)采樣點(diǎn)的位置根據(jù)原始數(shù)據(jù)分布進(jìn)行合理調(diào)整,實(shí)現(xiàn)在壓縮數(shù)據(jù)集中數(shù)據(jù)樣本數(shù)量的同時(shí),能夠有效保留原始數(shù)據(jù)集的形狀信息。接下來在數(shù)據(jù)集上使用現(xiàn)有的任意形狀聚類算法進(jìn)行處理,得到最終的聚類結(jié)果。本發(fā)明能夠使得在采樣數(shù)據(jù)集上的聚類結(jié)果與在原始數(shù)據(jù)集上的聚類結(jié)果基本一致。相較于現(xiàn)有的對(duì)大數(shù)據(jù)的任意形狀處理方法,本發(fā)明的方法能夠在保持結(jié)果準(zhǔn)確的前提下,極大的壓縮方法的運(yùn)行時(shí)間,因而比現(xiàn)有方法更加高效。