處理特征變量的方法、計算機(jī)可讀存儲介質(zhì)及計算機(jī)設(shè)備

基本信息

申請?zhí)?/td> CN201910057671.4 申請日 -
公開(公告)號 CN109816117A 公開(公告)日 2019-05-28
申請公布號 CN109816117A 申請公布日 2019-05-28
分類號 G06N20/00(2019.01)I 分類 計算;推算;計數(shù);
發(fā)明人 柴磊; 許靖; 李紅一; 尹帥 申請(專利權(quán))人 深圳魔數(shù)智擎科技有限公司
代理機(jī)構(gòu) 深圳市銘粵知識產(chǎn)權(quán)代理有限公司 代理人 深圳魔數(shù)智擎科技有限公司;深圳市魔數(shù)智擎人工智能有限公司
地址 518000 廣東省深圳市南山區(qū)前海深港合作區(qū)前灣一路1號A棟201室(入駐深圳市前海商務(wù)秘書有限公司)
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種處理特征變量的方法。所述方法包括:獲取多個包括多個特征變量的樣本中每個特征變量的缺失率和偏離度;根據(jù)每個特征變量的所述缺失率和所述偏離度計算出對應(yīng)每個特征變量的懲罰因子;利用所述懲罰因子對相應(yīng)的特征變量進(jìn)行懲罰處理。本發(fā)明可有效處理存在值缺失和/或是分類型特征變量的特征變量,該方法可提升機(jī)器學(xué)習(xí)模型的精度,同時還能夠降低機(jī)器學(xué)習(xí)模型過擬合的情況。