數(shù)據(jù)挖掘中基于密度的K中心點劃分聚類方法

基本信息

申請?zhí)?/td> CN201510208624.7 申請日 -
公開(公告)號 CN104765879A 公開(公告)日 2015-07-08
申請公布號 CN104765879A 申請公布日 2015-07-08
分類號 G06F17/30(2006.01)I 分類 計算;推算;計數(shù);
發(fā)明人 袁啟龍;史海波;周曉鋒 申請(專利權(quán))人 無錫中科泛在信息技術(shù)研發(fā)中心有限公司
代理機構(gòu) 無錫市大為專利商標事務(wù)所(普通合伙) 代理人 殷紅梅;張濤
地址 214135 江蘇省無錫市新區(qū)菱湖大道200號中國傳感網(wǎng)國際創(chuàng)新園C座
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及一種數(shù)據(jù)挖掘中基于密度的K中心點劃分聚類方法,其包括如下步驟:步驟1、給定所需的數(shù)據(jù)集,并確定聚類個數(shù)K;步驟2、計算數(shù)據(jù)對象的密度及平均密度;步驟3、計算數(shù)據(jù)集內(nèi)每個數(shù)據(jù)對象的最小密度距離值;步驟4、對數(shù)據(jù)集內(nèi)數(shù)據(jù)對象的最小密度距離值進行降序排序,根據(jù)確定的聚類個數(shù)K,從大到小選擇K個與最小密度距離值對應并且密度大于平均密度的數(shù)據(jù)對象作為聚類中心;步驟5、將數(shù)據(jù)集內(nèi)的數(shù)據(jù)對象分配到與所述數(shù)據(jù)對象距離最近的初始聚類中心,得到聚類結(jié)果。本發(fā)明能夠選出高質(zhì)量的中心點,而不需要像K均值算法中的后續(xù)迭代更新步驟,其降低計算復雜度,提高分類的準確率,穩(wěn)定性高,提高運算效率。