一種基于SBS的層次化特征選擇方法、系統(tǒng)及應(yīng)用
基本信息
申請?zhí)?/td> | CN201910342155.6 | 申請日 | - |
公開(公告)號 | CN110197706B | 公開(公告)日 | 2021-08-27 |
申請公布號 | CN110197706B | 申請公布日 | 2021-08-27 |
分類號 | G16H10/60(2018.01)I;G16H50/70(2018.01)I;G06K9/62(2006.01)I | 分類 | 物理 |
發(fā)明人 | 羅寧政;蔡志平;孫文成;王明;劉海濱;黃克濤;胡健;黃浪 | 申請(專利權(quán))人 | 深圳市寧遠科技股份有限公司 |
代理機構(gòu) | 長沙國科天河知識產(chǎn)權(quán)代理有限公司 | 代理人 | 邱軼 |
地址 | 518000廣東省深圳市南山區(qū)南山街道東濱路4078號永新時代廣場2號樓11-12樓 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明提供一種基于SBS的層次化特征選擇方法、系統(tǒng)及應(yīng)用,該方法包括獲取數(shù)據(jù)集;根據(jù)CatBoost模型擬合所有的類別集,獲取每個類別集的權(quán)重值W1;根據(jù)XGBoost模型擬合所有的特征數(shù)據(jù)集,獲取每個特征數(shù)據(jù)的重要性分數(shù)W2;根據(jù)每個類別集的權(quán)重值W1及每個特征數(shù)據(jù)的重要性分數(shù)W2,獲取每個項目的全局參數(shù)W=W1*W2;并對每個特征數(shù)據(jù)按照全局參數(shù)W由高到低進行排序;根據(jù)SBS算法,每輪迭代刪除排名最差的特征數(shù)據(jù),并記錄剩余子集的均方差值MSE;獲取標(biāo)均差值MSE最小的剩余子集,作為最優(yōu)子集O輸出。用于解決現(xiàn)有技術(shù)中數(shù)據(jù)處理的實用性和準(zhǔn)確性不高等問題,基于數(shù)據(jù)內(nèi)部的聯(lián)系進行層次化特征選擇,提高數(shù)據(jù)處理的實用性和準(zhǔn)確性。 |
