用于機(jī)器學(xué)習(xí)算法的數(shù)據(jù)預(yù)處理方法及相關(guān)設(shè)備

基本信息

申請(qǐng)?zhí)?/td> CN202110513199.8 申請(qǐng)日 -
公開(公告)號(hào) CN113157987A 公開(公告)日 2021-07-23
申請(qǐng)公布號(hào) CN113157987A 申請(qǐng)公布日 2021-07-23
分類號(hào) G06F16/9035;G06K9/62;G06N20/00 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 鄭鳳 申請(qǐng)(專利權(quán))人 航天網(wǎng)安技術(shù)(深圳)有限公司
代理機(jī)構(gòu) 北京風(fēng)雅頌專利代理有限公司 代理人 孫曉鳳
地址 518067 廣東省深圳市南山區(qū)粵海街道深圳灣生態(tài)科技園十一棟11A四樓裙樓A06房
法律狀態(tài) -

摘要

摘要 本公開提供一種用于機(jī)器學(xué)習(xí)算法的數(shù)據(jù)預(yù)處理方法及相關(guān)設(shè)備,所述方法包括:獲取待處理的原始數(shù)據(jù);基于所述原始數(shù)據(jù)每個(gè)特征的缺失值進(jìn)行篩查,以得到第一篩查數(shù)據(jù);基于所述第一篩查數(shù)據(jù)中每個(gè)特征的相同值進(jìn)行篩查,以確定第二篩查數(shù)據(jù);將所述第二篩查數(shù)據(jù)中每個(gè)特征的缺失值進(jìn)行填充,以得到完整數(shù)據(jù);將所述完整數(shù)據(jù)按照預(yù)設(shè)的標(biāo)準(zhǔn)化處理規(guī)則進(jìn)行標(biāo)準(zhǔn)化處理,以獲取所述標(biāo)準(zhǔn)化處理后的完整數(shù)據(jù)。本公開實(shí)施例能夠?qū)Y(jié)構(gòu)化數(shù)據(jù)進(jìn)行數(shù)據(jù)預(yù)處理,通過對(duì)數(shù)據(jù)的異常值進(jìn)行處理,提高了數(shù)據(jù)的可用性和數(shù)據(jù)質(zhì)量,節(jié)省了在機(jī)器學(xué)習(xí)算法開發(fā)時(shí)的大量人力物力。