一種垃圾數(shù)據(jù)深度過濾方法及系統(tǒng)
基本信息
申請(qǐng)?zhí)?/td> | CN202110122376.X | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN112784910A | 公開(公告)日 | 2021-05-11 |
申請(qǐng)公布號(hào) | CN112784910A | 申請(qǐng)公布日 | 2021-05-11 |
分類號(hào) | G06K9/62;G06N3/00;G06N3/04;G06N3/08 | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 蒙政先;蔡楚才 | 申請(qǐng)(專利權(quán))人 | 武漢市博暢軟件開發(fā)有限公司 |
代理機(jī)構(gòu) | 武漢紅觀專利代理事務(wù)所(普通合伙) | 代理人 | 陳凱 |
地址 | 430000 湖北省武漢市東湖開發(fā)區(qū)東門路以東、南環(huán)鐵路以南、關(guān)山二路以西、中環(huán)線以北當(dāng)代科技園(華夏創(chuàng)業(yè)中心)一期2號(hào)樓10層9號(hào)02室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開一種垃圾數(shù)據(jù)深度過濾方法及系統(tǒng),所述方法包括:獲取網(wǎng)絡(luò)數(shù)據(jù),對(duì)所述網(wǎng)絡(luò)數(shù)據(jù)進(jìn)行五元組初步過濾;將初步過濾后的數(shù)據(jù)進(jìn)行文本向量化表示,采用改進(jìn)的k均值聚類算法對(duì)向量化表示的文本進(jìn)行聚類劃分,確定數(shù)據(jù)源,基于數(shù)據(jù)源進(jìn)行二次過濾;基于卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行深度內(nèi)容過濾。本發(fā)明實(shí)現(xiàn)了對(duì)非法數(shù)據(jù)和垃圾進(jìn)行多層次深度過濾,保障數(shù)據(jù)安全,提高過濾精度。 |
