基于大數(shù)據(jù)的用戶畫像構(gòu)建方法、裝置及存儲(chǔ)介質(zhì)

基本信息

申請(qǐng)?zhí)?/td> CN202110294601.8 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN113051324A 公開(kāi)(公告)日 2021-06-29
申請(qǐng)公布號(hào) CN113051324A 申請(qǐng)公布日 2021-06-29
分類號(hào) G06F16/25;G06F16/28;G06K9/62 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 孫圣力;陳忠毅;李青山;司華友 申請(qǐng)(專利權(quán))人 南京博雅區(qū)塊鏈研究院有限公司
代理機(jī)構(gòu) 無(wú)錫永樂(lè)唯勤專利代理事務(wù)所(普通合伙) 代理人 孫際德
地址 210000 江蘇省南京市鼓樓區(qū)漢中門大街301號(hào)1102-2室
法律狀態(tài) -

摘要

摘要 本發(fā)明提供了一種基于大數(shù)據(jù)的用戶畫像構(gòu)建方法、裝置及存儲(chǔ)介質(zhì),其中的方法包括:建立用戶畫像標(biāo)簽體系;采集用戶數(shù)據(jù)并存儲(chǔ)至數(shù)據(jù)倉(cāng)庫(kù)內(nèi)預(yù)先構(gòu)建好的實(shí)體表和事實(shí)表內(nèi);將實(shí)體表和事實(shí)表進(jìn)行ID?Mapping關(guān)聯(lián)以實(shí)現(xiàn)對(duì)用戶數(shù)據(jù)的聚合;基于用戶畫像標(biāo)簽體系,對(duì)于每一個(gè)標(biāo)簽,從數(shù)據(jù)倉(cāng)庫(kù)中獲取與所述標(biāo)簽相關(guān)的用戶數(shù)據(jù)處理后保存至用戶畫像數(shù)據(jù)庫(kù)。本發(fā)明采用數(shù)據(jù)倉(cāng)庫(kù)技術(shù)實(shí)現(xiàn)對(duì)海量用戶數(shù)據(jù)的存儲(chǔ)及處理,提高了大數(shù)據(jù)時(shí)代對(duì)海量數(shù)據(jù)的處理需求。此外,本發(fā)明采用包括機(jī)器學(xué)習(xí)算法在內(nèi)的數(shù)據(jù)挖掘工具實(shí)現(xiàn)對(duì)非結(jié)構(gòu)用戶數(shù)據(jù)的處理,從而獲得更加豐富的標(biāo)簽數(shù)據(jù),提升了用戶畫像的標(biāo)簽豐富度。