一種基于SBS的層次化特征選擇方法、系統(tǒng)及應(yīng)用

基本信息

申請?zhí)?/td> CN201910342155.6 申請日 -
公開(公告)號 CN110197706A 公開(公告)日 2019-09-03
申請公布號 CN110197706A 申請公布日 2019-09-03
分類號 G16H10/60(2018.01)I; G16H50/70(2018.01)I; G06K9/62(2006.01)I 分類 物理
發(fā)明人 羅寧政; 蔡志平; 孫文成; 王明; 劉海濱; 黃克濤; 胡健; 黃浪 申請(專利權(quán))人 深圳市寧遠科技股份有限公司
代理機構(gòu) 長沙國科天河知識產(chǎn)權(quán)代理有限公司 代理人 深圳市寧遠科技股份有限公司
地址 518000 廣東省深圳市南山區(qū)南山街道東濱路4078號永新時代廣場2號樓11-12樓
法律狀態(tài) -

摘要

摘要 本發(fā)明提供一種基于SBS的層次化特征選擇方法、系統(tǒng)及應(yīng)用,該方法包括獲取數(shù)據(jù)集;根據(jù)CatBoost模型擬合所有的類別集,獲取每個類別集的權(quán)重值W1;根據(jù)XGBoost模型擬合所有的特征數(shù)據(jù)集,獲取每個特征數(shù)據(jù)的重要性分數(shù)W2;根據(jù)每個類別集的權(quán)重值W1及每個特征數(shù)據(jù)的重要性分數(shù)W2,獲取每個項目的全局參數(shù)W=W1*W2;并對每個特征數(shù)據(jù)按照全局參數(shù)W由高到低進行排序;根據(jù)SBS算法,每輪迭代刪除排名最差的特征數(shù)據(jù),并記錄剩余子集的均方差值MSE;獲取標均差值MSE最小的剩余子集,作為最優(yōu)子集O輸出。用于解決現(xiàn)有技術(shù)中數(shù)據(jù)處理的實用性和準確性不高等問題,基于數(shù)據(jù)內(nèi)部的聯(lián)系進行層次化特征選擇,提高數(shù)據(jù)處理的實用性和準確性。