基于RoaringBitmap的用戶數(shù)據(jù)統(tǒng)計方法

基本信息

申請?zhí)?/td> CN202011401560.X 申請日 -
公開(公告)號 CN112434085A 公開(公告)日 2021-03-02
申請公布號 CN112434085A 申請公布日 2021-03-02
分類號 G06F16/2458(2019.01)I;G06F16/22(2019.01)I 分類 計算;推算;計數(shù);
發(fā)明人 李興平;林允鵬 申請(專利權)人 四三九九網(wǎng)絡股份有限公司
代理機構 北京市盛峰律師事務所 代理人 席小東
地址 361009福建省廈門市思明區(qū)軟件園二期望海路2號
法律狀態(tài) -

摘要

摘要 本發(fā)明提供一種基于Roaring Bitmap的用戶數(shù)據(jù)統(tǒng)計方法,包括:將用戶唯一標識依次通過信息摘要算法MD5及MurmurHash3算法,哈希成int64位哈希值h;將哈希值h通過取余法進行降位,得到新的用戶唯一標識u;將新的用戶唯一標識u轉化為二進制數(shù);建立數(shù)據(jù)存儲結構;基于數(shù)據(jù)存儲結構,統(tǒng)計用戶是否為新用戶。本發(fā)明使用高性能Roaring Bitmap作為基礎數(shù)據(jù)結構對Bitmap進行壓縮,此外引入哈希算法并進行降位運算,使其支持字符型用戶唯一標識,同時在計算性能與精度中找到平衡;在用戶數(shù)據(jù)統(tǒng)計上具有空間占用小,計算速度快等特點,同時在數(shù)據(jù)持續(xù)增長的情況下依然能保持出色的性能。??