適用于分布式文件系統(tǒng)的文件隨機(jī)寫方法及系統(tǒng)

基本信息

申請(qǐng)?zhí)?/td> CN201910973982.5 申請(qǐng)日 -
公開(公告)號(hào) CN110795407B 公開(公告)日 2022-06-10
申請(qǐng)公布號(hào) CN110795407B 申請(qǐng)公布日 2022-06-10
分類號(hào) G06F16/172(2019.01)I;G06F16/182(2019.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 沈晨;杜真真;王敬平;黃子君;徐文遠(yuǎn);周潔;褚少鶴 申請(qǐng)(專利權(quán))人 華東計(jì)算技術(shù)研究所(中國(guó)電子科技集團(tuán)公司第三十二研究所)
代理機(jī)構(gòu) 上海段和段律師事務(wù)所 代理人 -
地址 201800上海市嘉定區(qū)嘉羅路1485號(hào)
法律狀態(tài) -

摘要

摘要 本發(fā)明提供了一種適用于分布式文件系統(tǒng)的文件隨機(jī)寫方法及系統(tǒng),包括:步驟1:將HDFS的寫接口更新成支持隨機(jī)寫模式,使隨機(jī)寫操作僅影響直接修改的塊或者有限的相鄰塊;步驟2:擴(kuò)展HDFS數(shù)據(jù)傳輸協(xié)議,使客戶端可訪問任意的數(shù)據(jù)分塊;步驟3:更新服務(wù)端數(shù)據(jù)包處理、更新校驗(yàn)值計(jì)算,獲取數(shù)據(jù)副本更新、校驗(yàn)值更新。本發(fā)明中,存儲(chǔ)于分布式文件系統(tǒng)的文件在更新數(shù)據(jù)內(nèi)容時(shí),只會(huì)影響當(dāng)前數(shù)據(jù)分塊及相鄰的數(shù)據(jù)分塊,而不會(huì)像原生HDFS需將整個(gè)文件寫回,造成大量不必要的數(shù)據(jù)傳輸,本發(fā)明有效的減少了數(shù)據(jù)傳輸和移動(dòng),緩解網(wǎng)絡(luò)帶寬壓力,降低客戶端和服務(wù)端的處理資源消耗。