基于郵件指紋對相同郵件進(jìn)行判定的方法

基本信息

申請?zhí)?/td> CN201610684970.7 申請日 -
公開(公告)號 CN106330670A 公開(公告)日 2017-01-11
申請公布號 CN106330670A 申請公布日 2017-01-11
分類號 H04L12/58(2006.01)I;G06F17/27(2006.01)I;G06F17/22(2006.01)I 分類 電通信技術(shù);
發(fā)明人 徐慧靈;紀(jì)春來 申請(專利權(quán))人 廈門容能科技有限公司
代理機(jī)構(gòu) 北京商專永信知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 無錫云商通科技有限公司;華云數(shù)據(jù)(廈門)網(wǎng)絡(luò)有限公司
地址 214000 江蘇省無錫市惠山經(jīng)濟(jì)開發(fā)區(qū)智慧路5號北-705室(開發(fā)區(qū))
法律狀態(tài) -

摘要

摘要 本發(fā)明提供了一種基于郵件指紋對相同郵件進(jìn)行判定的方法,通過對垃圾郵件樣本及待判定郵件的郵件指紋構(gòu)造出基礎(chǔ)指紋分詞及變形指紋分詞,將垃圾郵件樣本集合X與待判定郵件樣本集合Y中出現(xiàn)的相同元素進(jìn)行匹配并計數(shù),以得到重復(fù)度C;計算集合X與集合Y中所具有的相同元素的相似比例V,若相似比例V大于或者等于閾值K,則判定為相同郵件;若相似比例V小于設(shè)置閾值,則表示不同郵件;其中,相似比例V的計算公式為:V=2*C/(N+M)*100%。在本發(fā)明中,實現(xiàn)了對待判定郵件的批量化對比處理,實現(xiàn)了對相同郵件實現(xiàn)高效判斷,對為后期對接收的新郵件是否判定為垃圾郵件提供了科學(xué)參考,提高了對同一模板發(fā)送的垃圾郵件的識別效率。