基于元數(shù)據(jù)的智能化數(shù)據(jù)清洗方法及裝置
基本信息
申請(qǐng)?zhí)?/td> | CN202010906317.7 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN112000656A | 公開(公告)日 | 2020-11-27 |
申請(qǐng)公布號(hào) | CN112000656A | 申請(qǐng)公布日 | 2020-11-27 |
分類號(hào) | G06F16/215(2019.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 王曉明 | 申請(qǐng)(專利權(quán))人 | 北京天源迪科信息技術(shù)有限公司 |
代理機(jī)構(gòu) | 北京萬思博知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | 柴國(guó)偉 |
地址 | 北京市海淀區(qū)北四環(huán)西路56號(hào)8層802 | ||
法律狀態(tài) | - |
摘要
摘要 | 本申請(qǐng)公開了一種基于元數(shù)據(jù)的智能化數(shù)據(jù)清洗方法及裝置。所述方法包括:利用元數(shù)據(jù)管理工具從預(yù)先設(shè)置的質(zhì)量檢查規(guī)則模板中匹配出與源庫數(shù)據(jù)相適應(yīng)的數(shù)據(jù)質(zhì)量檢查規(guī)則模板;利用匹配出的數(shù)據(jù)質(zhì)量檢查規(guī)則模板對(duì)源庫數(shù)據(jù)進(jìn)行檢查,并生成數(shù)據(jù)質(zhì)量報(bào)告;根據(jù)匹配出的數(shù)據(jù)質(zhì)量檢查規(guī)則模板和所述數(shù)據(jù)質(zhì)量報(bào)告,構(gòu)建清洗任務(wù)腳本和清洗流程;利用構(gòu)建出的清洗任務(wù)腳本和清洗流程對(duì)源庫數(shù)據(jù)進(jìn)行清洗。所述裝置包括數(shù)據(jù)質(zhì)量檢查規(guī)則構(gòu)建模塊、源庫數(shù)據(jù)檢查模塊、清洗任務(wù)腳本和清洗流程構(gòu)建模塊和清洗模塊。?? |
