建設行業(yè)工程項目Excel文件數(shù)據(jù)格式化存儲方法及系統(tǒng)

基本信息

申請?zhí)?/td> CN201710440801.3 申請日 -
公開(公告)號 CN107193788A 公開(公告)日 2017-09-22
申請公布號 CN107193788A 申請公布日 2017-09-22
分類號 G06F17/21(2006.01)I;G06F17/27(2006.01)I 分類 計算;推算;計數(shù);
發(fā)明人 胡焱;黃寧;周金源;蘇志偉;張濤;侯曉峰;陳紅仙 申請(專利權)人 廣東中建普聯(lián)科技股份有限公司
代理機構 北京市盈科律師事務所 代理人 廣東中建普聯(lián)科技股份有限公司
地址 510000 廣東省廣州市天河區(qū)廣園快速路匯苑街23號廣東鐵路投資大廈6樓
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及一種建設行業(yè)工程項目Excel文件數(shù)據(jù)格式化存儲方法及系統(tǒng),方法包括以下步驟:A、基于分布式和高并發(fā)的計算機技術,在各客戶端上采集建設行業(yè)工程項目Excel文件,并提取Excel文件中的字段屬性信息;B、根據(jù)提取的字段屬性信息進行坐標定位并提取有效的關鍵特征字段;C、將有效的關鍵特征字段加入Kafka消息隊列,并利用反垃圾大數(shù)據(jù)算法對導入的Excel文件進行自動識別,識別出垃圾文件數(shù)據(jù)和標準格式數(shù)據(jù);D、將標準格式數(shù)據(jù)進行規(guī)約,并按照工程項目標準結構自動統(tǒng)計、匯總及存儲。本發(fā)明實現(xiàn)了一種高效的建設行業(yè)工程項目Excel文件數(shù)據(jù)格式化存儲方案,并具有識別效率更高、更準確等有益效果。