融合Boost模型的非平衡數(shù)據(jù)自適應采樣方法

基本信息

申請?zhí)?/td> CN201710218019.7 申請日 -
公開(公告)號 CN107133639A 公開(公告)日 2017-09-05
申請公布號 CN107133639A 申請公布日 2017-09-05
分類號 G06K9/62(2006.01)I 分類 計算;推算;計數(shù);
發(fā)明人 宋彬;徐慧囝;陳思佳;張艷 申請(專利權)人 蕪湖宣投智能科技有限公司
代理機構 安徽信拓律師事務所 代理人 婁爾玉
地址 241000 安徽省蕪湖市鏡湖區(qū)融匯錦江A區(qū)一號樓門面119室
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種將模型認知數(shù)據(jù)和加權特征空間數(shù)據(jù)分布相結從而優(yōu)化非平衡數(shù)據(jù)采樣性能的方法,主要解決現(xiàn)有采樣技術的盲目性、對現(xiàn)有特征信息的破壞以及在高維度數(shù)據(jù)上的不適用性。其實現(xiàn)模塊為:(1)算法初始化(2)基于Boost模型的數(shù)據(jù)認知與數(shù)據(jù)類型定義(3)基于加權特征空間的數(shù)據(jù)分布關系與數(shù)據(jù)類型定義(4)Boost定義數(shù)據(jù)集和加權空間定義數(shù)據(jù)集的融合(5)融合數(shù)據(jù)集中特征類型關聯(lián)的數(shù)據(jù)合成方法與冗余數(shù)據(jù)清除方法(6)算法迭代判斷模塊。本發(fā)明能夠結合模型認知數(shù)據(jù)信息和特征空間數(shù)據(jù)分布信息,在平衡數(shù)據(jù)同時去除冗余數(shù)據(jù),同時保護了數(shù)據(jù)原有特征結構,用于大數(shù)據(jù)領域中對不平衡數(shù)據(jù)的處理。