一種基于數(shù)據(jù)安全的混合聚類方法

基本信息

申請?zhí)?/td> CN201710312188.7 申請日 -
公開(公告)號 CN107122803B 公開(公告)日 2019-11-26
申請公布號 CN107122803B 申請公布日 2019-11-26
分類號 G06K9/62(2006.01) 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 孫麗萍; 陶濤; 郭良敏; 陳付龍; 羅永龍 申請(專利權(quán))人 青島華師智慧科技有限公司
代理機(jī)構(gòu) 蕪湖安匯知識產(chǎn)權(quán)代理有限公司 代理人 鐘雪;馬榮
地址 241000 安徽省蕪湖市弋江區(qū)花津南路安徽師范大學(xué)
法律狀態(tài) -

摘要

摘要 本發(fā)明適用于數(shù)據(jù)挖掘技術(shù)領(lǐng)域,提供了一種基于數(shù)據(jù)安全的混合聚類方法,該方法包括如下步驟:采用結(jié)合線性變換的旋轉(zhuǎn)擾動(dòng)方法對初始矩陣進(jìn)行擾動(dòng);利用密度峰聚類算法構(gòu)造初始質(zhì)心解空間;利用萬有引力搜索算法迭代完成數(shù)據(jù)點(diǎn)的聚類。本發(fā)明實(shí)施例采用結(jié)合線性變換的旋轉(zhuǎn)擾動(dòng)方法對初始矩陣進(jìn)行擾動(dòng),保證聚類的相似性度量函數(shù)不變,同時(shí)對原始數(shù)據(jù)進(jìn)行了數(shù)據(jù)隱私處理,之后利用密度峰聚類算法根據(jù)各數(shù)據(jù)點(diǎn)密度特性選取質(zhì)心的方法構(gòu)造初始質(zhì)心解空間,最后使用萬有引力搜索方法將擾動(dòng)后的數(shù)據(jù)依據(jù)相似性度量函數(shù)進(jìn)行聚類,直至所有數(shù)據(jù)對象完成聚類,且測評聚類質(zhì)量的總均方量化誤差最小,從而實(shí)現(xiàn)數(shù)據(jù)的最優(yōu)聚類,保證數(shù)據(jù)效用且隱藏?cái)?shù)據(jù)隱私。