基于元數(shù)據(jù)的智能化數(shù)據(jù)清洗方法及裝置

基本信息

申請(qǐng)?zhí)?/td> CN202010906317.7 申請(qǐng)日 -
公開(公告)號(hào) CN112000656A 公開(公告)日 2020-11-27
申請(qǐng)公布號(hào) CN112000656A 申請(qǐng)公布日 2020-11-27
分類號(hào) G06F16/215(2019.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 王曉明 申請(qǐng)(專利權(quán))人 北京天源迪科信息技術(shù)有限公司
代理機(jī)構(gòu) 北京萬思博知識(shí)產(chǎn)權(quán)代理有限公司 代理人 柴國(guó)偉
地址 北京市海淀區(qū)北四環(huán)西路56號(hào)8層802
法律狀態(tài) -

摘要

摘要 本申請(qǐng)公開了一種基于元數(shù)據(jù)的智能化數(shù)據(jù)清洗方法及裝置。所述方法包括:利用元數(shù)據(jù)管理工具從預(yù)先設(shè)置的質(zhì)量檢查規(guī)則模板中匹配出與源庫數(shù)據(jù)相適應(yīng)的數(shù)據(jù)質(zhì)量檢查規(guī)則模板;利用匹配出的數(shù)據(jù)質(zhì)量檢查規(guī)則模板對(duì)源庫數(shù)據(jù)進(jìn)行檢查,并生成數(shù)據(jù)質(zhì)量報(bào)告;根據(jù)匹配出的數(shù)據(jù)質(zhì)量檢查規(guī)則模板和所述數(shù)據(jù)質(zhì)量報(bào)告,構(gòu)建清洗任務(wù)腳本和清洗流程;利用構(gòu)建出的清洗任務(wù)腳本和清洗流程對(duì)源庫數(shù)據(jù)進(jìn)行清洗。所述裝置包括數(shù)據(jù)質(zhì)量檢查規(guī)則構(gòu)建模塊、源庫數(shù)據(jù)檢查模塊、清洗任務(wù)腳本和清洗流程構(gòu)建模塊和清洗模塊。??