基于郵件指紋對相同郵件進(jìn)行判定的方法
基本信息
申請?zhí)?/td> | CN201610684970.7 | 申請日 | - |
公開(公告)號 | CN106330670A | 公開(公告)日 | 2017-01-11 |
申請公布號 | CN106330670A | 申請公布日 | 2017-01-11 |
分類號 | H04L12/58(2006.01)I;G06F17/27(2006.01)I;G06F17/22(2006.01)I | 分類 | 電通信技術(shù); |
發(fā)明人 | 徐慧靈;紀(jì)春來 | 申請(專利權(quán))人 | 廈門容能科技有限公司 |
代理機(jī)構(gòu) | 北京商專永信知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) | 代理人 | 無錫云商通科技有限公司;華云數(shù)據(jù)(廈門)網(wǎng)絡(luò)有限公司 |
地址 | 214000 江蘇省無錫市惠山經(jīng)濟(jì)開發(fā)區(qū)智慧路5號北-705室(開發(fā)區(qū)) | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明提供了一種基于郵件指紋對相同郵件進(jìn)行判定的方法,通過對垃圾郵件樣本及待判定郵件的郵件指紋構(gòu)造出基礎(chǔ)指紋分詞及變形指紋分詞,將垃圾郵件樣本集合X與待判定郵件樣本集合Y中出現(xiàn)的相同元素進(jìn)行匹配并計數(shù),以得到重復(fù)度C;計算集合X與集合Y中所具有的相同元素的相似比例V,若相似比例V大于或者等于閾值K,則判定為相同郵件;若相似比例V小于設(shè)置閾值,則表示不同郵件;其中,相似比例V的計算公式為:V=2*C/(N+M)*100%。在本發(fā)明中,實現(xiàn)了對待判定郵件的批量化對比處理,實現(xiàn)了對相同郵件實現(xiàn)高效判斷,對為后期對接收的新郵件是否判定為垃圾郵件提供了科學(xué)參考,提高了對同一模板發(fā)送的垃圾郵件的識別效率。 |
