基于模糊聚類的網(wǎng)絡(luò)文本數(shù)據(jù)檢測方法
基本信息
申請?zhí)?/td> | CN200910219439.2 | 申請日 | - |
公開(公告)號 | CN101763404B | 公開(公告)日 | 2012-03-21 |
申請公布號 | CN101763404B | 申請公布日 | 2012-03-21 |
分類號 | G06F17/30(2006.01)I;G06F17/27(2006.01)I | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 趙安軍;王磊;王禮;楊宗良 | 申請(專利權(quán))人 | 陜西鼎泰科技發(fā)展有限責(zé)任公司 |
代理機(jī)構(gòu) | 西北工業(yè)大學(xué)專利中心 | 代理人 | 陜西鼎泰科技發(fā)展有限責(zé)任公司 |
地址 | 710072 陜西省西安市科技路30號合力紫郡大廈B-2001室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種基于模糊聚類的網(wǎng)絡(luò)文本數(shù)據(jù)檢測方法,先對提取的網(wǎng)絡(luò)內(nèi)容進(jìn)行預(yù)處理;對需要聚類的預(yù)處理后網(wǎng)絡(luò)內(nèi)容進(jìn)行特征提取后對網(wǎng)絡(luò)內(nèi)容進(jìn)行聚類,設(shè)定初始聚類數(shù)。在聚類過程中,一個聚類數(shù)對應(yīng)一個隸屬度矩陣,每個隸屬度矩陣都有一個平均信息熵值,平均信息熵基于密度函數(shù)選擇初始聚類中心,算法迭代過程中修改聚類數(shù),當(dāng)平均信息熵達(dá)到最小值時,所對應(yīng)的聚類數(shù)為最佳聚類數(shù)。最后將聚類結(jié)果返回給用戶。本發(fā)明具有高效的智能聚類效果,并且可以根據(jù)應(yīng)用的不同,調(diào)整聚類的精度,兼顧聚類的速度。 |
