一種數(shù)據(jù)特征重要性的分析方法及系統(tǒng)
基本信息
申請?zhí)?/td> | CN202010464925.7 | 申請日 | - |
公開(公告)號 | CN111612624A | 公開(公告)日 | 2020-09-01 |
申請公布號 | CN111612624A | 申請公布日 | 2020-09-01 |
分類號 | G06Q40/04(2012.01)I | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 吳凌坤 | 申請(專利權)人 | 深圳博普科技有限公司 |
代理機構 | 深圳市智勝聯(lián)合知識產權代理有限公司 | 代理人 | 深圳博普科技有限公司 |
地址 | 518000廣東省深圳市福田區(qū)上步中路1003號深圳市科學館801室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明實施例提供了一種數(shù)據(jù)特征重要性的分析方法及系統(tǒng),其中一種數(shù)據(jù)特征重要性的分析方法包括:獲取債券風險評估所需的債券樣本,并標記出債券樣本中樣本點的時間粒度,將其作為原始數(shù)據(jù)集;對所述原始數(shù)據(jù)集進行預處理,獲取均衡數(shù)據(jù)集;構建用于分析數(shù)據(jù)特征重要性的隨機森林模型;將所述均衡數(shù)據(jù)集輸入進所述隨機森林中進行計算,分析出各個數(shù)據(jù)特征的重要性排名。在收集了與債券風險評估有關的原始數(shù)據(jù)集后,通過預處理對原始數(shù)據(jù)集進行數(shù)據(jù)均衡化,以解決因數(shù)據(jù)中正負樣本比例不均,而導致無法對數(shù)據(jù)特征進行有效分析的問題,并且采用隨機森林算法對均衡化后的數(shù)據(jù)進行相應的數(shù)據(jù)特征分析,以找出比經(jīng)由傳統(tǒng)評估方法總結下來的用于評估債券風險所需的更加科學和準確的相關數(shù)據(jù)特征。?? |
