基于模糊聚類的網(wǎng)絡文本數(shù)據(jù)檢測方法

基本信息

申請?zhí)?/td> CN200910219439.2 申請日 -
公開(公告)號 CN101763404A 公開(公告)日 2010-06-30
申請公布號 CN101763404A 申請公布日 2010-06-30
分類號 G06F17/30(2006.01)I;G06F17/27(2006.01)I 分類 計算;推算;計數(shù);
發(fā)明人 趙安軍;王磊;王禮;楊宗良 申請(專利權)人 陜西鼎泰科技發(fā)展有限責任公司
代理機構(gòu) 西北工業(yè)大學專利中心 代理人 陜西鼎泰科技發(fā)展有限責任公司
地址 710072 陜西省西安市科技路30號合力紫郡大廈B-2001室
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種基于模糊聚類的網(wǎng)絡文本數(shù)據(jù)檢測方法,先對提取的網(wǎng)絡內(nèi)容進行預處理;對需要聚類的預處理后網(wǎng)絡內(nèi)容進行特征提取后對網(wǎng)絡內(nèi)容進行聚類,設定初始聚類數(shù)。在聚類過程中,一個聚類數(shù)對應一個隸屬度矩陣,每個隸屬度矩陣都有一個平均信息熵值,平均信息熵基于密度函數(shù)選擇初始聚類中心,算法迭代過程中修改聚類數(shù),當平均信息熵達到最小值時,所對應的聚類數(shù)為最佳聚類數(shù)。最后將聚類結(jié)果返回給用戶。本發(fā)明具有高效的智能聚類效果,并且可以根據(jù)應用的不同,調(diào)整聚類的精度,兼顧聚類的速度。