基于RoaringBitmap的用戶數(shù)據(jù)統(tǒng)計(jì)方法
基本信息
申請?zhí)?/td> | CN202011401560.X | 申請日 | - |
公開(公告)號 | CN112434085A | 公開(公告)日 | 2021-03-02 |
申請公布號 | CN112434085A | 申請公布日 | 2021-03-02 |
分類號 | G06F16/2458(2019.01)I;G06F16/22(2019.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 李興平;林允鵬 | 申請(專利權(quán))人 | 四三九九網(wǎng)絡(luò)股份有限公司 |
代理機(jī)構(gòu) | 北京市盛峰律師事務(wù)所 | 代理人 | 席小東 |
地址 | 361009福建省廈門市思明區(qū)軟件園二期望海路2號 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明提供一種基于Roaring Bitmap的用戶數(shù)據(jù)統(tǒng)計(jì)方法,包括:將用戶唯一標(biāo)識依次通過信息摘要算法MD5及MurmurHash3算法,哈希成int64位哈希值h;將哈希值h通過取余法進(jìn)行降位,得到新的用戶唯一標(biāo)識u;將新的用戶唯一標(biāo)識u轉(zhuǎn)化為二進(jìn)制數(shù);建立數(shù)據(jù)存儲結(jié)構(gòu);基于數(shù)據(jù)存儲結(jié)構(gòu),統(tǒng)計(jì)用戶是否為新用戶。本發(fā)明使用高性能Roaring Bitmap作為基礎(chǔ)數(shù)據(jù)結(jié)構(gòu)對Bitmap進(jìn)行壓縮,此外引入哈希算法并進(jìn)行降位運(yùn)算,使其支持字符型用戶唯一標(biāo)識,同時(shí)在計(jì)算性能與精度中找到平衡;在用戶數(shù)據(jù)統(tǒng)計(jì)上具有空間占用小,計(jì)算速度快等特點(diǎn),同時(shí)在數(shù)據(jù)持續(xù)增長的情況下依然能保持出色的性能。?? |
