一種面向重復(fù)數(shù)據(jù)刪除技術(shù)的指紋預(yù)取方法及系統(tǒng)

基本信息

申請(qǐng)?zhí)?/td> CN201310246927.9 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN103345449B 公開(kāi)(公告)日 2016-12-28
申請(qǐng)公布號(hào) CN103345449B 申請(qǐng)公布日 2016-12-28
分類號(hào) G06F12/0862(2016.01)I;G06F17/30(2006.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 鄧玉輝;宋梁山 申請(qǐng)(專利權(quán))人 廣州僑澤文化傳媒科技有限責(zé)任公司
代理機(jī)構(gòu) 廣州市華學(xué)知識(shí)產(chǎn)權(quán)代理有限公司 代理人 暨南大學(xué)
地址 510632 廣東省廣州市黃埔大道西601號(hào)
法律狀態(tài) -

摘要

摘要 本發(fā)明公開(kāi)了一種面向重復(fù)數(shù)據(jù)刪除技術(shù)的指紋預(yù)取方法及系統(tǒng),方法包括:首先利用文件的相似性特點(diǎn),將相似文件的所有指紋一次性預(yù)取到cache中,提高cache的命中率。如果未檢測(cè)到系統(tǒng)中的相似文件,則根據(jù)指紋的空間局部性,從指紋庫(kù)中最近訪問(wèn)的位置將后續(xù)可能訪問(wèn)到的指紋一次性預(yù)取到cache中。由于文件的相似性是通過(guò)數(shù)據(jù)塊采樣判定的,在很大的概率上保證兩個(gè)文件大部分?jǐn)?shù)據(jù)塊是相同。這種方法的指紋預(yù)取比局部性能更好的保證cache的命中率。同時(shí),經(jīng)過(guò)指紋順序排列模塊的指紋有了空間局部性,利用局部性特點(diǎn)繼續(xù)預(yù)取指紋也可以提高cache命中率。這樣,從兩個(gè)層次上基本可以保證絕大部分的cache命中率,極大的減少磁盤I/O帶來(lái)的開(kāi)銷。