基于混合采樣與特征選擇的高維度不平衡數(shù)據(jù)分類方法

基本信息

申請?zhí)?/td> CN202010524269.5 申請日 -
公開(公告)號 CN111695626A 公開(公告)日 2020-09-22
申請公布號 CN111695626A 申請公布日 2020-09-22
分類號 G06K9/62(2006.01)I 分類 計算;推算;計數(shù);
發(fā)明人 陳佐;易善濤;楊勝剛;朱桑之;谷浩然;楊捷琳 申請(專利權)人 湖南湖大金科科技發(fā)展有限公司
代理機構 成都行之專利代理事務所(普通合伙) 代理人 林菲菲
地址 415000湖南省常德市鼎城區(qū)灌溪鎮(zhèn)(常德高新技術產(chǎn)業(yè)開發(fā)區(qū)樟窯路-常德科技創(chuàng)新創(chuàng)業(yè)孵化產(chǎn)業(yè)園第二層230號)
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了基于混合采樣與特征選擇的高維度不平衡數(shù)據(jù)分類方法,本發(fā)明首先通過融合多個過濾器從多角度對信用卡欺詐數(shù)據(jù)集的特征重要性進行度量和評估并刪除無關特征,避免了單一過濾器進行特征選擇時效果不佳的問題,再結(jié)合SVM?RFE特征選擇算法刪除冗余特征,進一步尋找最優(yōu)特征子集,有效提高分類結(jié)果的精度;然后對數(shù)據(jù)集進行混合采樣以平衡數(shù)據(jù)集,最后利用Stacking策略融合多個基分類器,實現(xiàn)了數(shù)據(jù)精準分類。本發(fā)明有效提高了高維度不平衡數(shù)據(jù)分類精度和可靠性。??