數(shù)據(jù)挖掘中基于密度優(yōu)化初始中心的K均值聚類方法
基本信息
申請?zhí)?/td> | CN201510131975.2 | 申請日 | - |
公開(公告)號 | CN104731916A | 公開(公告)日 | 2015-06-24 |
申請公布號 | CN104731916A | 申請公布日 | 2015-06-24 |
分類號 | G06F17/30(2006.01)I | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 袁啟龍;史海波;周曉鋒 | 申請(專利權(quán))人 | 無錫中科泛在信息技術(shù)研發(fā)中心有限公司 |
代理機構(gòu) | 無錫市大為專利商標(biāo)事務(wù)所(普通合伙) | 代理人 | 殷紅梅;張濤 |
地址 | 214135 江蘇省無錫市新區(qū)菱湖大道200號中國傳感網(wǎng)國際創(chuàng)新園C座 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明涉及一種數(shù)據(jù)挖掘中基于密度優(yōu)化初始中心的K均值聚類方法,其包括如下步驟:步驟1、給定所需的數(shù)據(jù)集,并確定聚類個數(shù)K;步驟2、計算數(shù)據(jù)集內(nèi)所有數(shù)據(jù)對象的密度,并根據(jù)得到數(shù)據(jù)對象的密度計算數(shù)據(jù)集的平均密度;步驟3、計算數(shù)據(jù)集內(nèi)每個數(shù)據(jù)對象的最小密度距離值;步驟4、對數(shù)據(jù)集內(nèi)數(shù)據(jù)對象的最小密度距離值進(jìn)行降序排序,根據(jù)確定的聚類個數(shù)K,選擇與前K個最小密度距離值對應(yīng)并且密度大于平均密度的數(shù)據(jù)對象最為初始聚類中心;步驟5、根據(jù)上述獲得的初始聚類中心,利用K-means聚類方法對數(shù)據(jù)集進(jìn)行聚類,直至輸出聚類結(jié)果。本發(fā)明降低計算復(fù)雜度,提高分類的準(zhǔn)確率,穩(wěn)定性高,提高快速收斂。 |
