高頻用戶用電數(shù)據(jù)清洗方法、系統(tǒng)、設(shè)備及存儲(chǔ)介質(zhì)
基本信息
申請?zhí)?/td> | CN202110624156.7 | 申請日 | - |
公開(公告)號 | CN113468152A | 公開(公告)日 | 2021-10-01 |
申請公布號 | CN113468152A | 申請公布日 | 2021-10-01 |
分類號 | G06F16/215(2019.01)I;G06Q50/06(2012.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 郭乃網(wǎng);田英杰;朱征;謝偉;瞿海妮;奚增輝;蘇運(yùn);李凡;吳裔;趙瑩瑩;張菲菲;阮靜嫻;金妍斐 | 申請(專利權(quán))人 | 國網(wǎng)上海能源互聯(lián)網(wǎng)研究院有限公司 |
代理機(jī)構(gòu) | 上海科盛知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | 丁云 |
地址 | 200122上海市浦東新區(qū)自由貿(mào)易試驗(yàn)區(qū)源深路1122號 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明涉及一種高頻用戶用電數(shù)據(jù)清洗方法、系統(tǒng)、設(shè)備及存儲(chǔ)介質(zhì),所述的方法包括以下步驟:S1:讀取用戶用電數(shù)據(jù);S2:對用戶群進(jìn)行切分;S3:對切分后的用戶進(jìn)行異常值的檢測及剔除;S4:對用戶用電數(shù)據(jù)進(jìn)行預(yù)填充,獲取預(yù)填充后的各用戶用電數(shù)據(jù)的缺失率,剔除缺失率大于缺失率閾值的用戶用電數(shù)據(jù);S5:根據(jù)用戶用電數(shù)據(jù)的連續(xù)缺失最大天數(shù)判斷用戶用電數(shù)據(jù)的缺失模式,根據(jù)缺失模式對用戶用電數(shù)據(jù)進(jìn)行填充;S6:對填充結(jié)果進(jìn)行校驗(yàn),利用鄰近值填充法填充未填充數(shù)據(jù),獲取清洗結(jié)果。與現(xiàn)有技術(shù)相比,本發(fā)明有效提高數(shù)據(jù)清洗效果和填充效率,提高數(shù)據(jù)填充的準(zhǔn)確性。 |
