一種異構數據源的數據預處理方法
基本信息
申請?zhí)?/td> | CN201610789185.8 | 申請日 | - |
公開(公告)號 | CN106372185B | 公開(公告)日 | 2017-07-04 |
申請公布號 | CN106372185B | 申請公布日 | 2017-07-04 |
分類號 | G06F17/30 | 分類 | 計算;推算;計數; |
發(fā)明人 | 李志敏;梁柏超;賀文鋒 | 申請(專利權)人 | 廣東名陽信息科技有限公司 |
代理機構 | 北京孚睿灣知識產權代理事務所(普通合伙) | 代理人 | 李丹丹 |
地址 | 528200 廣東省佛山市桂城街道深海路17號瀚天科技城A區(qū)8號樓十樓1004單元 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明提供了一種異構數據源的數據預處理方法,包括以下步驟:從多個異構數據源中讀取異構數據;基于預處理規(guī)則庫對所述異構數據進行預處理得到規(guī)格化數據;將所述規(guī)格化數據存儲在數據庫中,用于數據集成、數據挖掘和/或企業(yè)的在線聯機分析處理。其使得政法業(yè)務數據可以共享,該方法通用性好,易于擴展,并對數據進行遞進式的三次預處理,且處理過程可以回溯,使得處理規(guī)則易于修改,提高了數據處理效率及處理精度,且能基于錯誤的日志修改提取規(guī)則,將數據統(tǒng)一存儲提供對外服務。 |
