一種去除郵件干擾信息的方法以及垃圾郵件判定方法

基本信息

申請?zhí)?/td> CN201610584290.8 申請日 -
公開(公告)號 CN106227808B 公開(公告)日 2019-04-05
申請公布號 CN106227808B 申請公布日 2019-04-05
分類號 G06F16/84(2019.01)I; G06F17/27(2006.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 徐慧靈; 紀(jì)春來 申請(專利權(quán))人 廈門容能科技有限公司
代理機(jī)構(gòu) 蘇州友佳知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 廈門容能科技有限公司;華云數(shù)據(jù)(廈門)網(wǎng)絡(luò)有限公司;安徽愛辦公信息技術(shù)有限公司
地址 中國(福建)自由貿(mào)易試驗(yàn)區(qū)廈門片區(qū)(保稅區(qū))象嶼路97號廈門國際航運(yùn)中心D棟8層05單元X
法律狀態(tài) -

摘要

摘要 本發(fā)明揭示了一種去除郵件干擾信息的方法以及垃圾郵件判定方法,該去除郵件干擾信息的方法包括:獲取郵件中包含的html內(nèi)容;對html內(nèi)容執(zhí)行構(gòu)建文檔對向模型,并對文檔對向模型執(zhí)行以下至少一種或者多種干擾識別處理后將html內(nèi)容轉(zhuǎn)換為文本信息,所述干擾識別處理包括:顏色塊干擾識別處理、字體大小干擾識別處理、表格干擾識別處理;將處理后的文本信息進(jìn)行內(nèi)容重組。通過本發(fā)明,能夠?qū)崿F(xiàn)對垃圾郵件中所包含的干擾信息與文本信息有效分離,能夠精確的識別垃圾郵件中人為封裝的各種干擾信息,為后續(xù)對郵件判定是否為垃圾郵件提供了準(zhǔn)確依據(jù),并能有效的提高對垃圾郵件的攔截及過濾效果。