金融風(fēng)控領(lǐng)域多特征融合提取方法
基本信息
申請?zhí)?/td> | CN201710272618.7 | 申請日 | - |
公開(公告)號 | CN107423871A | 公開(公告)日 | 2017-12-01 |
申請公布號 | CN107423871A | 申請公布日 | 2017-12-01 |
分類號 | G06Q10/06;G06Q40/00 | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 張林江 | 申請(專利權(quán))人 | 成都知數(shù)科技有限公司 |
代理機構(gòu) | 成都頂峰專利事務(wù)所(普通合伙) | 代理人 | 任遠(yuǎn)高 |
地址 | 610000 四川省成都市高新西區(qū)西芯大道4號 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明涉及金融網(wǎng)控技術(shù)領(lǐng)域,公開了金融風(fēng)控領(lǐng)域多特征融合提取方法,獲取原始用戶ID對應(yīng)的原始樣本數(shù)據(jù);對獲取的原始樣本數(shù)據(jù)中的臟數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗;提取基礎(chǔ)數(shù)據(jù)構(gòu)成基礎(chǔ)特征,并將基礎(chǔ)特征與原始用戶ID進(jìn)行一一對應(yīng)關(guān)聯(lián)產(chǎn)生訓(xùn)練樣本;將訓(xùn)練樣本錄入至機器學(xué)習(xí)模型中,所述機器學(xué)習(xí)模型中設(shè)有隨機森林,隨機森林中包含有多個決策樹模型,經(jīng)過決策樹模型訓(xùn)練后形成一系列的葉子節(jié)點,并通過one?hot編碼對葉子節(jié)點進(jìn)行離散編碼,離散編碼與原始用戶ID對應(yīng)形成用戶的離散特征;將分別對應(yīng)有相同原始用戶ID的基礎(chǔ)特征和離散特征進(jìn)行關(guān)聯(lián)合并得到的聚合訓(xùn)練數(shù)據(jù),解決了現(xiàn)有的特征處理模式單一、特征暴力組合導(dǎo)致數(shù)據(jù)呈指數(shù)型爆炸的問題。 |
