一種信貸變量數(shù)據(jù)的進(jìn)行高緯變量篩選的方法
基本信息
申請(qǐng)?zhí)?/td> | CN202111494508.8 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN114119211A | 公開(公告)日 | 2022-03-01 |
申請(qǐng)公布號(hào) | CN114119211A | 申請(qǐng)公布日 | 2022-03-01 |
分類號(hào) | G06Q40/02(2012.01)I;G06F17/18(2006.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 鐘磊;田羽;劉銀龍;段笑;游江珊 | 申請(qǐng)(專利權(quán))人 | 武漢眾邦銀行股份有限公司 |
代理機(jī)構(gòu) | 成都正煜知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) | 代理人 | 李龍 |
地址 | 432200湖北省武漢市黃陂區(qū)盤龍城經(jīng)濟(jì)開發(fā)區(qū)漢口北大道88號(hào)漢口北國際商品交易中心D2區(qū)1-2層、22-23層 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明涉及信用評(píng)分建模領(lǐng)域,提供了一種信貸變量數(shù)據(jù)的進(jìn)行高緯變量篩選的方法。目的在于解決如何充分篩選高維變量,嘗試構(gòu)建一種新的變量篩選方法來輔助信用評(píng)分建模,確保得到的建模模型的最佳準(zhǔn)確度。主要方案包括獲取申請(qǐng)數(shù)據(jù)、放款數(shù)據(jù)、逾期數(shù)據(jù)、征信數(shù)據(jù);截取一段時(shí)間的數(shù)據(jù),根據(jù)cumauc歸納方法對(duì)提取的數(shù)據(jù)進(jìn)行初步篩選,選取auc值大的數(shù)據(jù);對(duì)初步篩選的變量進(jìn)行卡方分箱,卡方分箱使得每個(gè)數(shù)據(jù)有單獨(dú)的權(quán)重,為后續(xù)的評(píng)分模型引入非線性,降低了模型過擬合的風(fēng)險(xiǎn),選取權(quán)重較高的數(shù)據(jù);根據(jù)篩選得到的數(shù)據(jù)進(jìn)行stepwise逐步回歸分析,最終得到所有的符合篩選條件的數(shù)據(jù)。 |
