數(shù)據(jù)抽樣方法、裝置、存儲(chǔ)介質(zhì)和處理器

基本信息

申請(qǐng)?zhí)?/td> CN201910599090.3 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN110399413A 公開(kāi)(公告)日 2019-11-01
申請(qǐng)公布號(hào) CN110399413A 申請(qǐng)公布日 2019-11-01
分類(lèi)號(hào) G06F16/25(2019.01)I; G06F16/27(2019.01)I 分類(lèi) 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 李瑋巍; 吳明璞; 李剛毅 申請(qǐng)(專(zhuān)利權(quán))人 博彥科技股份有限公司
代理機(jī)構(gòu) 北京康信知識(shí)產(chǎn)權(quán)代理有限責(zé)任公司 代理人 董文倩
地址 100193 北京市海淀區(qū)西北旺東路10號(hào)院東區(qū)7號(hào)樓(博彥科技大廈)
法律狀態(tài) -

摘要

摘要 本發(fā)明公開(kāi)了一種數(shù)據(jù)抽樣方法、裝置、存儲(chǔ)介質(zhì)和處理器。其中,該方法包括:獲取分布式存儲(chǔ)系統(tǒng)中的數(shù)據(jù)分布信息,其中,分布式存儲(chǔ)系統(tǒng)包括多個(gè)存儲(chǔ)分區(qū),數(shù)據(jù)分布信息用于表示每個(gè)存儲(chǔ)分區(qū)的數(shù)據(jù)分布情況;根據(jù)數(shù)據(jù)分布信息,確定每個(gè)存儲(chǔ)分區(qū)對(duì)應(yīng)的抽樣條件,其中,抽樣條件包括如下至少之一:抽樣比例、抽樣數(shù)量;按照抽樣條件對(duì)存儲(chǔ)分區(qū)進(jìn)行數(shù)據(jù)抽樣,得到抽樣結(jié)果。本發(fā)明解決了基于分布式存儲(chǔ)系統(tǒng)進(jìn)行數(shù)據(jù)抽樣的效率較低的技術(shù)問(wèn)題。