一種鐵路主數據的清洗方法

基本信息

申請?zhí)?/td> CN201510498531.2 申請日 -
公開(公告)號 CN105183949B 公開(公告)日 2019-03-19
申請公布號 CN105183949B 申請公布日 2019-03-19
分類號 G06F17/50(2006.01)I 分類 計算;推算;計數;
發(fā)明人 李平; 史天運; 王英杰; 馬小寧; 鄒丹; 劉彥軍; 劉軍; 王虎; 楊連報; 潘佩芬; 盧瑞珊; 劉俊 申請(專利權)人 鐵科華鐵經緯(天津)信息技術有限公司
代理機構 北京路浩知識產權代理有限公司 代理人 中國鐵道科學研究院;中國鐵道科學研究院電子計算技術研究所;北京經緯信息技術公司;中國鐵道科學研究院集團有限公司;中國鐵道科學研究院集團有限公司電子計算技術研究所;北京經緯信息技術有限公司
地址 100081 北京市海淀區(qū)大柳樹路2號
法律狀態(tài) -

摘要

摘要 本發(fā)明提供了一種鐵路主數據的清洗方法,該方法包括:構建鐵路主數據屬性模型;接收導入數據屬性模型的導入數據;對導入數據的編碼數據進行唯一性檢驗;根據預設的編碼規(guī)則,對通過唯一性檢驗的導入數據中的編碼數據,利用正值表達式方式進行數據格式驗證;將通過數據格式驗證的編碼數據寫入主數據屬性模型,并將存在空缺值、錯誤值或沖突值的錯誤數據作為異常編碼數據進行記錄;對主數據屬性模型中編碼數據的變化狀態(tài)進行記錄,繪制編碼數據的變化軌跡,以實現編碼數據的管理。本發(fā)明大大提高了數據清洗的準確度,降低了數據清洗的成本,使導入的數據和已有數據保持一致,提高數據的共享性。