基于RoaringBitmap的用戶數(shù)據(jù)統(tǒng)計方法
基本信息
申請?zhí)?/td> | CN202011401560.X | 申請日 | - |
公開(公告)號 | CN112434085A | 公開(公告)日 | 2021-03-02 |
申請公布號 | CN112434085A | 申請公布日 | 2021-03-02 |
分類號 | G06F16/2458(2019.01)I;G06F16/22(2019.01)I | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 李興平;林允鵬 | 申請(專利權)人 | 四三九九網(wǎng)絡股份有限公司 |
代理機構 | 北京市盛峰律師事務所 | 代理人 | 席小東 |
地址 | 361009福建省廈門市思明區(qū)軟件園二期望海路2號 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明提供一種基于Roaring Bitmap的用戶數(shù)據(jù)統(tǒng)計方法,包括:將用戶唯一標識依次通過信息摘要算法MD5及MurmurHash3算法,哈希成int64位哈希值h;將哈希值h通過取余法進行降位,得到新的用戶唯一標識u;將新的用戶唯一標識u轉化為二進制數(shù);建立數(shù)據(jù)存儲結構;基于數(shù)據(jù)存儲結構,統(tǒng)計用戶是否為新用戶。本發(fā)明使用高性能Roaring Bitmap作為基礎數(shù)據(jù)結構對Bitmap進行壓縮,此外引入哈希算法并進行降位運算,使其支持字符型用戶唯一標識,同時在計算性能與精度中找到平衡;在用戶數(shù)據(jù)統(tǒng)計上具有空間占用小,計算速度快等特點,同時在數(shù)據(jù)持續(xù)增長的情況下依然能保持出色的性能。?? |
