融合Boost模型的非平衡數(shù)據(jù)自適應采樣方法
基本信息
申請?zhí)?/td> | CN201710218019.7 | 申請日 | - |
公開(公告)號 | CN107133639A | 公開(公告)日 | 2017-09-05 |
申請公布號 | CN107133639A | 申請公布日 | 2017-09-05 |
分類號 | G06K9/62(2006.01)I | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 宋彬;徐慧囝;陳思佳;張艷 | 申請(專利權)人 | 蕪湖宣投智能科技有限公司 |
代理機構 | 安徽信拓律師事務所 | 代理人 | 婁爾玉 |
地址 | 241000 安徽省蕪湖市鏡湖區(qū)融匯錦江A區(qū)一號樓門面119室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種將模型認知數(shù)據(jù)和加權特征空間數(shù)據(jù)分布相結從而優(yōu)化非平衡數(shù)據(jù)采樣性能的方法,主要解決現(xiàn)有采樣技術的盲目性、對現(xiàn)有特征信息的破壞以及在高維度數(shù)據(jù)上的不適用性。其實現(xiàn)模塊為:(1)算法初始化(2)基于Boost模型的數(shù)據(jù)認知與數(shù)據(jù)類型定義(3)基于加權特征空間的數(shù)據(jù)分布關系與數(shù)據(jù)類型定義(4)Boost定義數(shù)據(jù)集和加權空間定義數(shù)據(jù)集的融合(5)融合數(shù)據(jù)集中特征類型關聯(lián)的數(shù)據(jù)合成方法與冗余數(shù)據(jù)清除方法(6)算法迭代判斷模塊。本發(fā)明能夠結合模型認知數(shù)據(jù)信息和特征空間數(shù)據(jù)分布信息,在平衡數(shù)據(jù)同時去除冗余數(shù)據(jù),同時保護了數(shù)據(jù)原有特征結構,用于大數(shù)據(jù)領域中對不平衡數(shù)據(jù)的處理。 |
