基于模糊聚類的網(wǎng)絡文本數(shù)據(jù)檢測方法
基本信息
申請?zhí)?/td> | CN200910219439.2 | 申請日 | - |
公開(公告)號 | CN101763404A | 公開(公告)日 | 2010-06-30 |
申請公布號 | CN101763404A | 申請公布日 | 2010-06-30 |
分類號 | G06F17/30(2006.01)I;G06F17/27(2006.01)I | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 趙安軍;王磊;王禮;楊宗良 | 申請(專利權)人 | 陜西鼎泰科技發(fā)展有限責任公司 |
代理機構(gòu) | 西北工業(yè)大學專利中心 | 代理人 | 陜西鼎泰科技發(fā)展有限責任公司 |
地址 | 710072 陜西省西安市科技路30號合力紫郡大廈B-2001室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種基于模糊聚類的網(wǎng)絡文本數(shù)據(jù)檢測方法,先對提取的網(wǎng)絡內(nèi)容進行預處理;對需要聚類的預處理后網(wǎng)絡內(nèi)容進行特征提取后對網(wǎng)絡內(nèi)容進行聚類,設定初始聚類數(shù)。在聚類過程中,一個聚類數(shù)對應一個隸屬度矩陣,每個隸屬度矩陣都有一個平均信息熵值,平均信息熵基于密度函數(shù)選擇初始聚類中心,算法迭代過程中修改聚類數(shù),當平均信息熵達到最小值時,所對應的聚類數(shù)為最佳聚類數(shù)。最后將聚類結(jié)果返回給用戶。本發(fā)明具有高效的智能聚類效果,并且可以根據(jù)應用的不同,調(diào)整聚類的精度,兼顧聚類的速度。 |
