金融風(fēng)控領(lǐng)域多特征融合提取方法

基本信息

申請?zhí)?/td> CN201710272618.7 申請日 -
公開(公告)號 CN107423871A 公開(公告)日 2017-12-01
申請公布號 CN107423871A 申請公布日 2017-12-01
分類號 G06Q10/06;G06Q40/00 分類 計算;推算;計數(shù);
發(fā)明人 張林江 申請(專利權(quán))人 成都知數(shù)科技有限公司
代理機構(gòu) 成都頂峰專利事務(wù)所(普通合伙) 代理人 任遠(yuǎn)高
地址 610000 四川省成都市高新西區(qū)西芯大道4號
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及金融網(wǎng)控技術(shù)領(lǐng)域,公開了金融風(fēng)控領(lǐng)域多特征融合提取方法,獲取原始用戶ID對應(yīng)的原始樣本數(shù)據(jù);對獲取的原始樣本數(shù)據(jù)中的臟數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗;提取基礎(chǔ)數(shù)據(jù)構(gòu)成基礎(chǔ)特征,并將基礎(chǔ)特征與原始用戶ID進(jìn)行一一對應(yīng)關(guān)聯(lián)產(chǎn)生訓(xùn)練樣本;將訓(xùn)練樣本錄入至機器學(xué)習(xí)模型中,所述機器學(xué)習(xí)模型中設(shè)有隨機森林,隨機森林中包含有多個決策樹模型,經(jīng)過決策樹模型訓(xùn)練后形成一系列的葉子節(jié)點,并通過one?hot編碼對葉子節(jié)點進(jìn)行離散編碼,離散編碼與原始用戶ID對應(yīng)形成用戶的離散特征;將分別對應(yīng)有相同原始用戶ID的基礎(chǔ)特征和離散特征進(jìn)行關(guān)聯(lián)合并得到的聚合訓(xùn)練數(shù)據(jù),解決了現(xiàn)有的特征處理模式單一、特征暴力組合導(dǎo)致數(shù)據(jù)呈指數(shù)型爆炸的問題。