一種通用的大數(shù)據(jù)采集字節(jié)流解析系統(tǒng)及其實現(xiàn)方法

基本信息

申請?zhí)?/td> CN201610565549.4 申請日 -
公開(公告)號 CN106254313A 公開(公告)日 2016-12-21
申請公布號 CN106254313A 申請公布日 2016-12-21
分類號 H04L29/06(2006.01)I 分類 電通信技術(shù);
發(fā)明人 吳建州;季統(tǒng)凱 申請(專利權(quán))人 襲明科技(廣東)有限公司
代理機構(gòu) 廣東莞信律師事務(wù)所 代理人 余倫
地址 523808 廣東省東莞市松山湖科技產(chǎn)業(yè)園區(qū)松科苑14號樓
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及計算機應(yīng)用技術(shù)領(lǐng)域,特別是一種通用的大數(shù)據(jù)采集字節(jié)流解析系統(tǒng)及其實現(xiàn)方法。本發(fā)明由字節(jié)流預(yù)處理器和二維表解析器構(gòu)成。字節(jié)流預(yù)處理器根據(jù)約定自動校驗數(shù)據(jù)并根據(jù)壓縮和加密方式自動選擇相應(yīng)的解壓和解密方法對數(shù)據(jù)進行預(yù)處理;二維表解析器按照字節(jié)流格式定義二維表,用行和行組存儲數(shù)據(jù)信息,用列標(biāo)明每個字段的名稱、數(shù)據(jù)類型和長度,讀入數(shù)據(jù)字節(jié)流后,根據(jù)每一列定義的比特長度將字節(jié)流分割成多個字段,再根據(jù)數(shù)據(jù)類型將分割好的字節(jié)流解析成相應(yīng)的信息;通過讀取行或者行組里的多個行獲取數(shù)據(jù)或者集合信息,通過列的字段名稱讀取數(shù)據(jù)行的具體字段信息。本發(fā)明避免重復(fù)定義和編寫解析過程;可以適用于大數(shù)據(jù)采集中對結(jié)構(gòu)復(fù)雜多樣的數(shù)據(jù)進行統(tǒng)一的解析。