建設行業(yè)工程項目Excel文件數(shù)據(jù)格式化存儲方法及系統(tǒng)
基本信息
申請?zhí)?/td> | CN201710440801.3 | 申請日 | - |
公開(公告)號 | CN107193788A | 公開(公告)日 | 2017-09-22 |
申請公布號 | CN107193788A | 申請公布日 | 2017-09-22 |
分類號 | G06F17/21(2006.01)I;G06F17/27(2006.01)I | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 胡焱;黃寧;周金源;蘇志偉;張濤;侯曉峰;陳紅仙 | 申請(專利權)人 | 廣東中建普聯(lián)科技股份有限公司 |
代理機構 | 北京市盈科律師事務所 | 代理人 | 廣東中建普聯(lián)科技股份有限公司 |
地址 | 510000 廣東省廣州市天河區(qū)廣園快速路匯苑街23號廣東鐵路投資大廈6樓 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明涉及一種建設行業(yè)工程項目Excel文件數(shù)據(jù)格式化存儲方法及系統(tǒng),方法包括以下步驟:A、基于分布式和高并發(fā)的計算機技術,在各客戶端上采集建設行業(yè)工程項目Excel文件,并提取Excel文件中的字段屬性信息;B、根據(jù)提取的字段屬性信息進行坐標定位并提取有效的關鍵特征字段;C、將有效的關鍵特征字段加入Kafka消息隊列,并利用反垃圾大數(shù)據(jù)算法對導入的Excel文件進行自動識別,識別出垃圾文件數(shù)據(jù)和標準格式數(shù)據(jù);D、將標準格式數(shù)據(jù)進行規(guī)約,并按照工程項目標準結構自動統(tǒng)計、匯總及存儲。本發(fā)明實現(xiàn)了一種高效的建設行業(yè)工程項目Excel文件數(shù)據(jù)格式化存儲方案,并具有識別效率更高、更準確等有益效果。 |
