一種金融電銷場景中對負(fù)樣本做消減的采樣方法
基本信息
申請?zhí)?/td> | CN202011393908.5 | 申請日 | - |
公開(公告)號 | CN112463781A | 公開(公告)日 | 2021-03-09 |
申請公布號 | CN112463781A | 申請公布日 | 2021-03-09 |
分類號 | G06F16/215(2019.01)I;G06Q40/00(2012.01)I;G06F16/28(2019.01)I;G06Q10/06(2012.01)I | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 田興邦;何國濤;蒲瑤;李全忠 | 申請(專利權(quán))人 | 普強時代(珠海橫琴)信息技術(shù)有限公司 |
代理機構(gòu) | 北京科億知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) | 代理人 | 湯東鳳 |
地址 | 100000北京市海淀區(qū)北清路四維圖新大廈F座二層 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明提供一種金融電銷場景中對負(fù)樣本做消減的采樣方法,具體步驟為:從金融場景營銷的數(shù)據(jù)獲取客戶結(jié)構(gòu)化維度,將數(shù)據(jù)分為三個子集,分別占全量比為80%(A),10%(V),10%(T);對A數(shù)據(jù)子集的正例集做聚類;計算在所有類邊界外的V數(shù)據(jù)子集和T數(shù)據(jù)子集所有的正例個數(shù)和負(fù)例個數(shù);計算V數(shù)據(jù)子集的正反例個數(shù)比:V_r;T數(shù)據(jù)子集的正反例個數(shù)比:T_r;并計算D_r=|T_r?V_r|;將T數(shù)據(jù)子集所有邊界外的正/反例記錄為S_w;對每一維度值為數(shù)字的重復(fù)上面的計算,累記每一維度的邊界;將所有S_w聯(lián)集為S_all,計算S_all中的正例個數(shù),反例個數(shù);假設(shè)原本分類器對T數(shù)據(jù)子集的AUC值為auc,計算新的AUC值A(chǔ)UC_new。本發(fā)明所提出的方法為非隨機的,能準(zhǔn)確的將多數(shù)的樣例減少而同時控制少數(shù)的樣例的減少,因此能同時保證AUC不下降。?? |
