基于RoaringBitmap的用戶數(shù)據(jù)統(tǒng)計(jì)方法

基本信息

申請?zhí)?/td> CN202011401560.X 申請日 -
公開(公告)號 CN112434085A 公開(公告)日 2021-03-02
申請公布號 CN112434085A 申請公布日 2021-03-02
分類號 G06F16/2458(2019.01)I;G06F16/22(2019.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 李興平;林允鵬 申請(專利權(quán))人 四三九九網(wǎng)絡(luò)股份有限公司
代理機(jī)構(gòu) 北京市盛峰律師事務(wù)所 代理人 席小東
地址 361009福建省廈門市思明區(qū)軟件園二期望海路2號
法律狀態(tài) -

摘要

摘要 本發(fā)明提供一種基于Roaring Bitmap的用戶數(shù)據(jù)統(tǒng)計(jì)方法,包括:將用戶唯一標(biāo)識依次通過信息摘要算法MD5及MurmurHash3算法,哈希成int64位哈希值h;將哈希值h通過取余法進(jìn)行降位,得到新的用戶唯一標(biāo)識u;將新的用戶唯一標(biāo)識u轉(zhuǎn)化為二進(jìn)制數(shù);建立數(shù)據(jù)存儲結(jié)構(gòu);基于數(shù)據(jù)存儲結(jié)構(gòu),統(tǒng)計(jì)用戶是否為新用戶。本發(fā)明使用高性能Roaring Bitmap作為基礎(chǔ)數(shù)據(jù)結(jié)構(gòu)對Bitmap進(jìn)行壓縮,此外引入哈希算法并進(jìn)行降位運(yùn)算,使其支持字符型用戶唯一標(biāo)識,同時(shí)在計(jì)算性能與精度中找到平衡;在用戶數(shù)據(jù)統(tǒng)計(jì)上具有空間占用小,計(jì)算速度快等特點(diǎn),同時(shí)在數(shù)據(jù)持續(xù)增長的情況下依然能保持出色的性能。??