一種面向大數(shù)據(jù)中任意形狀數(shù)據(jù)簇的快速聚類方法
基本信息
申請(qǐng)?zhí)?/td> | CN201710059010.6 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN106844692A | 公開(公告)日 | 2017-06-13 |
申請(qǐng)公布號(hào) | CN106844692A | 申請(qǐng)公布日 | 2017-06-13 |
分類號(hào) | G06F17/30(2006.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 李宗鵬;黃浩 | 申請(qǐng)(專利權(quán))人 | 武漢萬般上品信息技術(shù)有限公司 |
代理機(jī)構(gòu) | 武漢科皓知識(shí)產(chǎn)權(quán)代理事務(wù)所(特殊普通合伙) | 代理人 | 武漢萬般上品信息技術(shù)有限公司 |
地址 | 430070 湖北省武漢市東湖新技術(shù)開發(fā)區(qū)光谷大道303號(hào)光谷芯中心2-07棟201-03室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種面向大數(shù)據(jù)中任意形狀數(shù)據(jù)簇的快速聚類方法;通過對(duì)海量數(shù)據(jù)進(jìn)行采樣,并且對(duì)采樣點(diǎn)的位置根據(jù)原始數(shù)據(jù)分布進(jìn)行合理調(diào)整,實(shí)現(xiàn)在壓縮數(shù)據(jù)集中數(shù)據(jù)樣本數(shù)量的同時(shí),能夠有效保留原始數(shù)據(jù)集的形狀信息。接下來在數(shù)據(jù)集上使用現(xiàn)有的任意形狀聚類算法進(jìn)行處理,得到最終的聚類結(jié)果。本發(fā)明能夠使得在采樣數(shù)據(jù)集上的聚類結(jié)果與在原始數(shù)據(jù)集上的聚類結(jié)果基本一致。相較于現(xiàn)有的對(duì)大數(shù)據(jù)的任意形狀處理方法,本發(fā)明的方法能夠在保持結(jié)果準(zhǔn)確的前提下,極大的壓縮方法的運(yùn)行時(shí)間,因而比現(xiàn)有方法更加高效。 |
