一種高維不完整數(shù)據(jù)特征選擇方法

基本信息

申請?zhí)?/td> CN201710388939.3 申請日 -
公開(公告)號 CN107220346B 公開(公告)日 2021-04-30
申請公布號 CN107220346B 申請公布日 2021-04-30
分類號 G06F16/28 分類 計算;推算;計數(shù);
發(fā)明人 李玉諾;尹春福;王妍;楊鈞;李俊;吳陽;付永全 申請(專利權(quán))人 榮科科技股份有限公司
代理機構(gòu) 沈陽杰克知識產(chǎn)權(quán)代理有限公司 代理人 羅瑩
地址 110027 遼寧省沈陽市經(jīng)濟技術(shù)開發(fā)區(qū)開發(fā)大路7甲3號
法律狀態(tài) -

摘要

摘要 一種高維不完整數(shù)據(jù)特征選擇方法,涉及如下步驟:(1)判斷初始數(shù)據(jù)是否為完整數(shù)據(jù);若為不完整數(shù)據(jù),則轉(zhuǎn)到步驟(2);若為完整數(shù)據(jù),則轉(zhuǎn)到步驟(3);步驟(2):假設(shè)現(xiàn)在有各個維度的數(shù)據(jù),用1表示該數(shù)據(jù)項是完整的,用0表示該數(shù)據(jù)項是缺失的.計算每個維度的缺失率,接著計算缺失熵:依次算出每個維度的缺失熵;對結(jié)果進行加權(quán)平均;步驟(3):在高維數(shù)據(jù)中進行特征選擇時,通過比較原始數(shù)據(jù)矩陣的相關(guān)矩陣和隨機矩陣在奇異值上的差異,對相關(guān)矩陣進行去噪。得到去噪后的相關(guān)矩陣和選擇特征的數(shù)量,再進行奇異值分解,通過分解矩陣獲得特征與類的相關(guān)性,根據(jù)特征與類的相關(guān)性和特征之間冗余性完成特征選擇。