一種面向工業(yè)大數(shù)據(jù)的數(shù)據(jù)清洗和事件處理的云平臺系統(tǒng)
基本信息
申請?zhí)?/td> | CN202010329550.3 | 申請日 | - |
公開(公告)號 | CN113535422A | 公開(公告)日 | 2021-10-22 |
申請公布號 | CN113535422A | 申請公布日 | 2021-10-22 |
分類號 | G06F9/54(2006.01)I;G06F9/50(2006.01)I;G06F16/215(2019.01)I;G06F16/2458(2019.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 卓琳;黃晁;方浩杰 | 申請(專利權(quán))人 | 寧波中科信息技術(shù)應(yīng)用研究院(寧波人工智能產(chǎn)業(yè)研究院) |
代理機(jī)構(gòu) | - | 代理人 | - |
地址 | 315040浙江省寧波市高新區(qū)光華路299弄19號C9幢9層 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種面向工業(yè)大數(shù)據(jù)的數(shù)據(jù)清洗和事件處理的云平臺系統(tǒng),該系統(tǒng)可實(shí)現(xiàn)多數(shù)據(jù)源數(shù)據(jù)實(shí)時(shí)采集、數(shù)據(jù)預(yù)處理、重復(fù)記錄檢測和清洗、事件關(guān)系建模,從而提高數(shù)據(jù)質(zhì)量,為企業(yè)優(yōu)化流程、預(yù)防故障、提高生產(chǎn)效益和社會價(jià)值提供實(shí)時(shí)可靠的事件信息。為了實(shí)現(xiàn)上述目的,本發(fā)明提供一種面向工業(yè)大數(shù)據(jù)的數(shù)據(jù)清洗和事件處理的云平臺系統(tǒng),該系統(tǒng)包括:多數(shù)據(jù)源數(shù)據(jù)采集模塊,用于從多個(gè)不同數(shù)據(jù)源系統(tǒng)采集不同格式的非結(jié)構(gòu)化數(shù)據(jù),存入消息中間件;數(shù)據(jù)預(yù)處理模塊,用于數(shù)據(jù)格式標(biāo)準(zhǔn)化、規(guī)范化,屬性拆分、合并,缺失值補(bǔ)全等操作;重復(fù)記錄檢測和清洗模塊,用于識別相似重復(fù)記錄,檢測并清洗離群點(diǎn)數(shù)據(jù);事件關(guān)系建模模塊,用于對之前處理的一系列完整和詳細(xì)的對事件描述的事件集合進(jìn)行分類和關(guān)聯(lián),構(gòu)建出事件關(guān)聯(lián)圖。 |
