面向行業(yè)領(lǐng)域的同源樣本數(shù)據(jù)分類存儲(chǔ)的預(yù)處理方法及系統(tǒng)

基本信息

申請(qǐng)?zhí)?/td> CN201710660357.6 申請(qǐng)日 -
公開(公告)號(hào) CN107612707B 公開(公告)日 2021-04-09
申請(qǐng)公布號(hào) CN107612707B 申請(qǐng)公布日 2021-04-09
分類號(hào) G06F16/955(2019.01)I;G06F16/9532(2019.01)I;H04L12/24(2006.01)I;G06F16/951(2019.01)I;G06F16/953(2019.01)I 分類 電通信技術(shù);
發(fā)明人 魏曉林 申請(qǐng)(專利權(quán))人 深圳市其樂游戲科技有限公司
代理機(jī)構(gòu) 深圳市恒程創(chuàng)新知識(shí)產(chǎn)權(quán)代理有限公司 代理人 趙愛蓉
地址 518000廣東省深圳市前海深港合作區(qū)臨海大道59號(hào)海運(yùn)中心主塔樓13樓-13112
法律狀態(tài) -

摘要

摘要 面向行業(yè)領(lǐng)域的同源樣本數(shù)據(jù)分類存儲(chǔ)的預(yù)處理方法、系統(tǒng),屬于數(shù)據(jù)處理領(lǐng)域。本發(fā)明方法包括步驟S1,創(chuàng)建包含各行業(yè)領(lǐng)域平臺(tái)字段的關(guān)鍵字集;步驟S2,獲得用戶網(wǎng)絡(luò)內(nèi)所有成員的網(wǎng)絡(luò)行為日志數(shù)據(jù),對(duì)所述網(wǎng)絡(luò)行為日志數(shù)據(jù)進(jìn)行行業(yè)領(lǐng)域匹配并進(jìn)行行業(yè)領(lǐng)域劃分;步驟S3,根據(jù)經(jīng)過行業(yè)領(lǐng)域劃分的所述網(wǎng)絡(luò)行為日志數(shù)據(jù)對(duì)所述成員在各個(gè)領(lǐng)域內(nèi)的網(wǎng)絡(luò)行為活動(dòng)進(jìn)行分析,推測(cè)用戶的基本屬性和網(wǎng)絡(luò)行為特性進(jìn)分類儲(chǔ)存,實(shí)現(xiàn)面向行業(yè)領(lǐng)域的同源樣本數(shù)據(jù)分類存儲(chǔ)的預(yù)處理。本發(fā)明實(shí)現(xiàn)同源樣本數(shù)據(jù)在多個(gè)行業(yè)領(lǐng)域的用戶行為日志集,多維度進(jìn)行分類預(yù)處理存儲(chǔ),為用戶網(wǎng)絡(luò)行為畫像和各用戶之間的關(guān)聯(lián)提供多維度的數(shù)據(jù)依據(jù),具有重要作用和商業(yè)價(jià)值。??