一種大數(shù)據(jù)清洗方法、系統(tǒng)及相關裝置
基本信息
申請?zhí)?/td> | CN201910085511.0 | 申請日 | - |
公開(公告)號 | CN109800220B | 公開(公告)日 | 2020-12-15 |
申請公布號 | CN109800220B | 申請公布日 | 2020-12-15 |
分類號 | G06F16/215 | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 胡暉;廖建克 | 申請(專利權)人 | 浙江國貿(mào)云商控股有限公司 |
代理機構 | 北京集佳知識產(chǎn)權代理有限公司 | 代理人 | 羅滿 |
地址 | 310000 浙江省杭州市江干區(qū)紅普路綠谷創(chuàng)新中心6號樓8樓 | ||
法律狀態(tài) | - |
摘要
摘要 | 本申請所提供的一種大數(shù)據(jù)清洗方法,包括:采用與數(shù)據(jù)來源對應的數(shù)據(jù)獲取方法采集貿(mào)易數(shù)據(jù);在將貿(mào)易數(shù)據(jù)進行存儲后,獲取貿(mào)易數(shù)據(jù)中的目標數(shù)據(jù);利用分子篩算法對目標數(shù)據(jù)進行聚合處理,得到清洗后的各個結果集??梢?,該方法利用分子篩算法對目標數(shù)據(jù)進行聚合處理,得到清洗后的各個結果集,也就是說可以將異類值過濾掉,進而提高數(shù)據(jù)清洗修正的精度。此外,本申請還克服了相關技術中數(shù)據(jù)清洗顆粒度不夠、收斂速度較慢等問題。本申請還提供一種大數(shù)據(jù)清洗系統(tǒng)、設備及計算機可讀存儲介質(zhì),均具有上述有益效果。 |
