分析數(shù)據(jù)質(zhì)量方法

基本信息

申請(qǐng)?zhí)?/td> CN201810628753.5 申請(qǐng)日 -
公開(公告)號(hào) CN109086299A 公開(公告)日 2018-12-25
申請(qǐng)公布號(hào) CN109086299A 申請(qǐng)公布日 2018-12-25
分類號(hào) G06F17/30;G06K9/62 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 張涵帥 申請(qǐng)(專利權(quán))人 北京至信普林科技有限公司
代理機(jī)構(gòu) - 代理人 -
地址 100094 北京市海淀區(qū)北四環(huán)西路67號(hào)中關(guān)村國(guó)際創(chuàng)新大廈602
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種分析數(shù)據(jù)質(zhì)量方法及方法,所述方法包括:獲取數(shù)據(jù)樣本;對(duì)所述數(shù)據(jù)樣本進(jìn)行處理,并以可視方式輸出處理結(jié)果;其中所述處理包括以下至少一種操作:缺失值分析、特征篩選、異常值分析、數(shù)據(jù)分布分析和/或重要性分析。本發(fā)明實(shí)施例的技術(shù)方案可以對(duì)所述數(shù)據(jù)樣本所有屬性進(jìn)行以下分析:其中所述處理包括以下至少一種操作:缺失值分析、特征篩選、異常值分析、數(shù)據(jù)分布分析和/或重要性分析,然后輸以可視方式輸出處理結(jié)果;從而避免對(duì)數(shù)據(jù)樣本單個(gè)屬性進(jìn)行分析產(chǎn)生重復(fù)性的代碼的問題。