一種信貸變量數(shù)據(jù)的進(jìn)行高緯變量篩選的方法

基本信息

申請(qǐng)?zhí)?/td> CN202111494508.8 申請(qǐng)日 -
公開(公告)號(hào) CN114119211A 公開(公告)日 2022-03-01
申請(qǐng)公布號(hào) CN114119211A 申請(qǐng)公布日 2022-03-01
分類號(hào) G06Q40/02(2012.01)I;G06F17/18(2006.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 鐘磊;田羽;劉銀龍;段笑;游江珊 申請(qǐng)(專利權(quán))人 武漢眾邦銀行股份有限公司
代理機(jī)構(gòu) 成都正煜知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 李龍
地址 432200湖北省武漢市黃陂區(qū)盤龍城經(jīng)濟(jì)開發(fā)區(qū)漢口北大道88號(hào)漢口北國際商品交易中心D2區(qū)1-2層、22-23層
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及信用評(píng)分建模領(lǐng)域,提供了一種信貸變量數(shù)據(jù)的進(jìn)行高緯變量篩選的方法。目的在于解決如何充分篩選高維變量,嘗試構(gòu)建一種新的變量篩選方法來輔助信用評(píng)分建模,確保得到的建模模型的最佳準(zhǔn)確度。主要方案包括獲取申請(qǐng)數(shù)據(jù)、放款數(shù)據(jù)、逾期數(shù)據(jù)、征信數(shù)據(jù);截取一段時(shí)間的數(shù)據(jù),根據(jù)cumauc歸納方法對(duì)提取的數(shù)據(jù)進(jìn)行初步篩選,選取auc值大的數(shù)據(jù);對(duì)初步篩選的變量進(jìn)行卡方分箱,卡方分箱使得每個(gè)數(shù)據(jù)有單獨(dú)的權(quán)重,為后續(xù)的評(píng)分模型引入非線性,降低了模型過擬合的風(fēng)險(xiǎn),選取權(quán)重較高的數(shù)據(jù);根據(jù)篩選得到的數(shù)據(jù)進(jìn)行stepwise逐步回歸分析,最終得到所有的符合篩選條件的數(shù)據(jù)。