一種基于SBS的層次化特征選擇方法、系統(tǒng)及應(yīng)用

基本信息

申請?zhí)?/td> CN201910342155.6 申請日 -
公開(公告)號 CN110197706B 公開(公告)日 2021-08-27
申請公布號 CN110197706B 申請公布日 2021-08-27
分類號 G16H10/60(2018.01)I;G16H50/70(2018.01)I;G06K9/62(2006.01)I 分類 物理
發(fā)明人 羅寧政;蔡志平;孫文成;王明;劉海濱;黃克濤;胡健;黃浪 申請(專利權(quán))人 深圳市寧遠科技股份有限公司
代理機構(gòu) 長沙國科天河知識產(chǎn)權(quán)代理有限公司 代理人 邱軼
地址 518000廣東省深圳市南山區(qū)南山街道東濱路4078號永新時代廣場2號樓11-12樓
法律狀態(tài) -

摘要

摘要 本發(fā)明提供一種基于SBS的層次化特征選擇方法、系統(tǒng)及應(yīng)用,該方法包括獲取數(shù)據(jù)集;根據(jù)CatBoost模型擬合所有的類別集,獲取每個類別集的權(quán)重值W1;根據(jù)XGBoost模型擬合所有的特征數(shù)據(jù)集,獲取每個特征數(shù)據(jù)的重要性分數(shù)W2;根據(jù)每個類別集的權(quán)重值W1及每個特征數(shù)據(jù)的重要性分數(shù)W2,獲取每個項目的全局參數(shù)W=W1*W2;并對每個特征數(shù)據(jù)按照全局參數(shù)W由高到低進行排序;根據(jù)SBS算法,每輪迭代刪除排名最差的特征數(shù)據(jù),并記錄剩余子集的均方差值MSE;獲取標(biāo)均差值MSE最小的剩余子集,作為最優(yōu)子集O輸出。用于解決現(xiàn)有技術(shù)中數(shù)據(jù)處理的實用性和準(zhǔn)確性不高等問題,基于數(shù)據(jù)內(nèi)部的聯(lián)系進行層次化特征選擇,提高數(shù)據(jù)處理的實用性和準(zhǔn)確性。