一種基于Hadoop平臺(tái)MapReduce環(huán)境下的隱私保護(hù)方法

基本信息

申請(qǐng)?zhí)?/td> CN202010805039.6 申請(qǐng)日 -
公開(公告)號(hào) CN111737759A 公開(公告)日 2020-10-02
申請(qǐng)公布號(hào) CN111737759A 申請(qǐng)公布日 2020-10-02
分類號(hào) G06F21/62;G06F16/22;G06F16/27;G06F16/25;G06F16/13;G06F16/182;G06K9/62 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 李鵬;王璇璇;徐鶴;王汝傳;樊衛(wèi)北;朱楓;程海濤;藍(lán)東婉;李友濤;張結(jié)魁 申請(qǐng)(專利權(quán))人 安徽晶奇網(wǎng)絡(luò)科技股份有限公司
代理機(jī)構(gòu) 南京正聯(lián)知識(shí)產(chǎn)權(quán)代理有限公司 代理人 王素琴
地址 210009 江蘇省南京市新模范馬路66號(hào)
法律狀態(tài) -

摘要

摘要 針對(duì)在分布式環(huán)境下海量數(shù)據(jù)在運(yùn)算處理的過程中容易遇到數(shù)據(jù)泄露以及惡意分析的問題,本發(fā)明提出一種基于Hadoop平臺(tái)MapReduce環(huán)境下的隱私保護(hù)方法,該方法通過使用Hadoop集群中的MapReduce技術(shù),結(jié)合隨機(jī)抽取記錄的方式,將數(shù)據(jù)集分配到各個(gè)節(jié)點(diǎn),并啟動(dòng)Map分任務(wù)進(jìn)行數(shù)據(jù)的整合處理。Reduce分任務(wù)通過使用指數(shù)機(jī)制完成屬性的選擇與更新,最后對(duì)葉子節(jié)點(diǎn)添加隨機(jī)噪聲,使得分類的結(jié)果滿足差分隱私。該方法在保證數(shù)據(jù)可用性的同時(shí)也具有較好的分類準(zhǔn)確率。