一種并行數(shù)據(jù)清洗方法

基本信息

申請(qǐng)?zhí)?/td> CN201910161073.1 申請(qǐng)日 -
公開(公告)號(hào) CN110069480A 公開(公告)日 2019-07-30
申請(qǐng)公布號(hào) CN110069480A 申請(qǐng)公布日 2019-07-30
分類號(hào) G06F16/215(2019.01)I; G06F16/2453(2019.01)I; G06F16/27(2019.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 姚箐晨; 陳德健 申請(qǐng)(專利權(quán))人 廣東恒??萍加邢薰?/a>
代理機(jī)構(gòu) 廣州三辰專利事務(wù)所(普通合伙) 代理人 陳惠珊
地址 529000 廣東省江門市蓬江區(qū)天宇路1號(hào)(電信副樓)二樓全部及四樓01室
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種并行數(shù)據(jù)清洗方法,通過構(gòu)建分布式并行數(shù)據(jù)清洗系統(tǒng)的整體架構(gòu),利用數(shù)據(jù)中所有違反約束關(guān)系的數(shù)據(jù)單元與相應(yīng)約束構(gòu)成沖突超圖,進(jìn)行數(shù)據(jù)清洗,并根據(jù)沖突超圖中數(shù)據(jù)單元與相應(yīng)的約束的位置,形成適合大量數(shù)據(jù)的快速數(shù)據(jù)清洗方法。通過本發(fā)明,能夠達(dá)到數(shù)據(jù)清洗修復(fù)速度更快,且算法復(fù)雜度較低,適合大量數(shù)據(jù)的修復(fù)。