一種基于HDFS的數(shù)據(jù)轉(zhuǎn)換存儲方法

基本信息

申請?zhí)?/td> CN202110547354.8 申請日 -
公開(公告)號 CN113190527A 公開(公告)日 2021-07-30
申請公布號 CN113190527A 申請公布日 2021-07-30
分類號 G06F16/182(2019.01)I;G06F16/215(2019.01)I;G06F16/2458(2019.01)I;G06F16/25(2019.01)I 分類 計算;推算;計數(shù);
發(fā)明人 鞏書凱;盧仁謙;梁先黎;鄒平 申請(專利權(quán))人 重慶忽米網(wǎng)絡科技有限公司
代理機構(gòu) 重慶博凱知識產(chǎn)權(quán)代理有限公司 代理人 黃河
地址 400041重慶市高新區(qū)萬科023創(chuàng)意天地萬科錦尚4幢3單元
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及計算機技術(shù)領(lǐng)域,具體涉及一種基于HDFS的數(shù)據(jù)轉(zhuǎn)換存儲方法,其配置HDFS存儲服務器并設(shè)置HDFS存儲服務器存儲文件的文件大?。蝗缓髮?shù)據(jù)源的數(shù)據(jù)轉(zhuǎn)換成大小與HDFS存儲服務器存儲文件的文件大小相適應的文件,并將對應的文件存儲在HDFS存儲服務器中。具體包括:將數(shù)據(jù)源接入設(shè)置的MongoDB數(shù)據(jù)庫中;對MongoDB數(shù)據(jù)庫中的熱數(shù)據(jù)進行數(shù)據(jù)清洗;配置HDFS存儲服務器存儲文件的文件大??;將數(shù)據(jù)清洗后的熱數(shù)據(jù)轉(zhuǎn)換成與HDFS存儲服務器存儲文件的文件大小相適應的固定大小文件,并將對應的固定大小文件存儲在HDFS存儲服務器中。本發(fā)明中的數(shù)據(jù)轉(zhuǎn)換存儲方法能夠在數(shù)據(jù)存儲前固定文件數(shù)據(jù)格式,從而能夠提升工業(yè)大數(shù)據(jù)的數(shù)據(jù)存儲效果。