網(wǎng)絡(luò)流量的數(shù)據(jù)處理方法、裝置、設(shè)備及存儲介質(zhì)

基本信息

申請?zhí)?/td> CN202011433549.1 申請日 -
公開(公告)號 CN112445771A 公開(公告)日 2021-03-05
申請公布號 CN112445771A 申請公布日 2021-03-05
分類號 G06F16/174(2019.01)I;H04L29/06(2006.01)I;G06F16/13(2019.01)I;G06F16/172(2019.01)I;G06F21/56(2013.01)I 分類 計算;推算;計數(shù);
發(fā)明人 肖勤勇 申請(專利權(quán))人 阿米華晟數(shù)據(jù)科技(江蘇)有限公司
代理機構(gòu) 北京致科知識產(chǎn)權(quán)代理有限公司 代理人 李洪娟;魏紅雅
地址 215300江蘇省蘇州市昆山市玉山鎮(zhèn)登云路288號海創(chuàng)大廈C座12樓
法律狀態(tài) -

摘要

摘要 本發(fā)明公開一種網(wǎng)絡(luò)流量的數(shù)據(jù)處理方法、裝置、設(shè)備及存儲介質(zhì),該方法包括:獲取待處理文件;根據(jù)所述待處理文件,確定第一哈希值;根據(jù)所述第一哈希值,獲取目標bloom過濾器的起始地址;若基于所述起始地址對應(yīng)的目標bloom過濾器確定所述待處理文件不存在,則對所述待處理文件進行存儲,和/或?qū)λ龃幚砦募M行安全檢測。通過將文件的哈希值映射到多個bloom過濾器的起始地址,基于文件的哈希值找到對應(yīng)的bloom過濾器,進一步基于bloom過濾器實現(xiàn)對文件的去重,相對于現(xiàn)有的基于哈希表進行去重,有效減少了內(nèi)存空間的占用。??