一種鐵路主數(shù)據(jù)的清洗方法及系統(tǒng)

基本信息

申請(qǐng)?zhí)?/td> CN201510498531.2 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN105183949A 公開(kāi)(公告)日 2015-12-23
申請(qǐng)公布號(hào) CN105183949A 申請(qǐng)公布日 2015-12-23
分類號(hào) G06F17/50(2006.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 李平;史天運(yùn);王英杰;馬小寧;鄒丹;劉彥軍;劉軍;王虎;楊連報(bào);潘佩芬;盧瑞珊;劉俊 申請(qǐng)(專利權(quán))人 鐵科華鐵經(jīng)緯(天津)信息技術(shù)有限公司
代理機(jī)構(gòu) 北京路浩知識(shí)產(chǎn)權(quán)代理有限公司 代理人 中國(guó)鐵道科學(xué)研究院;中國(guó)鐵道科學(xué)研究院電子計(jì)算技術(shù)研究所;北京經(jīng)緯信息技術(shù)公司;中國(guó)鐵道科學(xué)研究院集團(tuán)有限公司;中國(guó)鐵道科學(xué)研究院集團(tuán)有限公司電子計(jì)算技術(shù)研究所;北京經(jīng)緯信息技術(shù)有限公司
地址 100081 北京市海淀區(qū)大柳樹(shù)路2號(hào)
法律狀態(tài) -

摘要

摘要 本發(fā)明提供了一種鐵路主數(shù)據(jù)的清洗方法及系統(tǒng),該方法包括:構(gòu)建鐵路主數(shù)據(jù)屬性模型;接收導(dǎo)入數(shù)據(jù)屬性模型的導(dǎo)入數(shù)據(jù);對(duì)導(dǎo)入數(shù)據(jù)的編碼數(shù)據(jù)進(jìn)行唯一性檢驗(yàn);根據(jù)預(yù)設(shè)的編碼規(guī)則,對(duì)通過(guò)唯一性檢驗(yàn)的導(dǎo)入數(shù)據(jù)中的編碼數(shù)據(jù),利用正值表達(dá)式方式進(jìn)行數(shù)據(jù)格式驗(yàn)證;將通過(guò)數(shù)據(jù)格式驗(yàn)證的編碼數(shù)據(jù)寫(xiě)入主數(shù)據(jù)屬性模型,并將存在空缺值、錯(cuò)誤值或沖突值的錯(cuò)誤數(shù)據(jù)作為異常編碼數(shù)據(jù)進(jìn)行記錄;對(duì)主數(shù)據(jù)屬性模型中編碼數(shù)據(jù)的變化狀態(tài)進(jìn)行記錄,繪制編碼數(shù)據(jù)的變化軌跡,以實(shí)現(xiàn)編碼數(shù)據(jù)的管理。本發(fā)明大大提高了數(shù)據(jù)清洗的準(zhǔn)確度,降低了數(shù)據(jù)清洗的成本,使導(dǎo)入的數(shù)據(jù)和已有數(shù)據(jù)保持一致,提高數(shù)據(jù)的共享性。