一種通用的大數(shù)據(jù)采集字節(jié)流解析系統(tǒng)及其實(shí)現(xiàn)方法
基本信息
申請?zhí)?/td> | CN201610565549.4 | 申請日 | - |
公開(公告)號(hào) | CN106254313B | 公開(公告)日 | 2019-06-21 |
申請公布號(hào) | CN106254313B | 申請公布日 | 2019-06-21 |
分類號(hào) | H04L29/06(2006.01)I | 分類 | 電通信技術(shù); |
發(fā)明人 | 吳建州; 季統(tǒng)凱 | 申請(專利權(quán))人 | 襲明科技(廣東)有限公司 |
代理機(jī)構(gòu) | 廣東莞信律師事務(wù)所 | 代理人 | 國云科技股份有限公司;襲明科技(廣東)有限公司 |
地址 | 523808 廣東省東莞市松山湖高新技術(shù)產(chǎn)業(yè)開發(fā)區(qū)科匯路1號(hào)中科院云計(jì)算中心19樓 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明涉及計(jì)算機(jī)應(yīng)用技術(shù)領(lǐng)域,特別是一種通用的大數(shù)據(jù)采集字節(jié)流解析系統(tǒng)及其實(shí)現(xiàn)方法。本發(fā)明由字節(jié)流預(yù)處理器和二維表解析器構(gòu)成。字節(jié)流預(yù)處理器根據(jù)約定自動(dòng)校驗(yàn)數(shù)據(jù)并根據(jù)壓縮和加密方式自動(dòng)選擇相應(yīng)的解壓和解密方法對(duì)數(shù)據(jù)進(jìn)行預(yù)處理;二維表解析器按照字節(jié)流格式定義二維表,用行和行組存儲(chǔ)數(shù)據(jù)信息,用列標(biāo)明每個(gè)字段的名稱、數(shù)據(jù)類型和長度,讀入數(shù)據(jù)字節(jié)流后,根據(jù)每一列定義的比特長度將字節(jié)流分割成多個(gè)字段,再根據(jù)數(shù)據(jù)類型將分割好的字節(jié)流解析成相應(yīng)的信息;通過讀取行或者行組里的多個(gè)行獲取數(shù)據(jù)或者集合信息,通過列的字段名稱讀取數(shù)據(jù)行的具體字段信息。本發(fā)明避免重復(fù)定義和編寫解析過程;可以適用于大數(shù)據(jù)采集中對(duì)結(jié)構(gòu)復(fù)雜多樣的數(shù)據(jù)進(jìn)行統(tǒng)一的解析。 |
