一種異構(gòu)數(shù)據(jù)源的數(shù)據(jù)預(yù)處理方法

基本信息

申請(qǐng)?zhí)?/td> CN201610789185.8 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN106372185B 公開(kāi)(公告)日 2017-07-04
申請(qǐng)公布號(hào) CN106372185B 申請(qǐng)公布日 2017-07-04
分類號(hào) G06F17/30 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 李志敏;梁柏超;賀文鋒 申請(qǐng)(專利權(quán))人 中共佛山市委政法委員會(huì)
代理機(jī)構(gòu) 北京孚睿灣知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 李丹丹
地址 528200 廣東省佛山市桂城街道深海路17號(hào)瀚天科技城A區(qū)8號(hào)樓十樓1004單元
法律狀態(tài) -

摘要

摘要 本發(fā)明提供了一種異構(gòu)數(shù)據(jù)源的數(shù)據(jù)預(yù)處理方法,包括以下步驟:從多個(gè)異構(gòu)數(shù)據(jù)源中讀取異構(gòu)數(shù)據(jù);基于預(yù)處理規(guī)則庫(kù)對(duì)所述異構(gòu)數(shù)據(jù)進(jìn)行預(yù)處理得到規(guī)格化數(shù)據(jù);將所述規(guī)格化數(shù)據(jù)存儲(chǔ)在數(shù)據(jù)庫(kù)中,用于數(shù)據(jù)集成、數(shù)據(jù)挖掘和/或企業(yè)的在線聯(lián)機(jī)分析處理。其使得政法業(yè)務(wù)數(shù)據(jù)可以共享,該方法通用性好,易于擴(kuò)展,并對(duì)數(shù)據(jù)進(jìn)行遞進(jìn)式的三次預(yù)處理,且處理過(guò)程可以回溯,使得處理規(guī)則易于修改,提高了數(shù)據(jù)處理效率及處理精度,且能基于錯(cuò)誤的日志修改提取規(guī)則,將數(shù)據(jù)統(tǒng)一存儲(chǔ)提供對(duì)外服務(wù)。