健康數(shù)據(jù)的去隱私化處理方法及系統(tǒng)

基本信息

申請(qǐng)?zhí)?/td> CN201811203455.8 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN109522740B 公開(kāi)(公告)日 2021-04-20
申請(qǐng)公布號(hào) CN109522740B 申請(qǐng)公布日 2021-04-20
分類號(hào) G06F21/62(2013.01)I;G06F40/279(2020.01)I;G06F16/35(2019.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 金以東;李雪莉;王語(yǔ)莫;周大勝 申請(qǐng)(專利權(quán))人 易?;ヂ?lián)醫(yī)療信息科技(北京)有限公司
代理機(jī)構(gòu) 北京科石知識(shí)產(chǎn)權(quán)代理有限公司 代理人 李艷霞
地址 100027北京市朝陽(yáng)區(qū)新源里16號(hào)14層2座12B06
法律狀態(tài) -

摘要

摘要 本申請(qǐng)?zhí)峁┮环N健康數(shù)據(jù)的去隱私化處理方法及系統(tǒng),方法包括:獲取健康數(shù)據(jù);判斷獲取的健康數(shù)據(jù)是結(jié)構(gòu)化數(shù)據(jù)還是非結(jié)構(gòu)化數(shù)據(jù);對(duì)于非結(jié)構(gòu)化數(shù)據(jù),分別提取非結(jié)構(gòu)化數(shù)據(jù)中的英文與數(shù)字類數(shù)據(jù)以及中文字符類數(shù)據(jù);對(duì)非結(jié)構(gòu)化數(shù)據(jù)中的中文字符類數(shù)據(jù)進(jìn)行維特比分詞,得到中文字符的分詞結(jié)果;對(duì)非結(jié)構(gòu)化數(shù)據(jù)中的中文字符類數(shù)據(jù)的分詞結(jié)果進(jìn)行維特比分類,得到結(jié)構(gòu)化數(shù)據(jù);對(duì)獲取的結(jié)構(gòu)化數(shù)據(jù)和處理得到的結(jié)構(gòu)化數(shù)據(jù)進(jìn)行去隱私化處理;輸出經(jīng)過(guò)掩碼與轉(zhuǎn)碼后的去隱私化健康數(shù)據(jù)。本申請(qǐng)通過(guò)分詞和分類處理將非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)換成結(jié)構(gòu)化數(shù)據(jù),通過(guò)對(duì)結(jié)構(gòu)化數(shù)據(jù)進(jìn)行敏感信息標(biāo)記和脫敏處理,能夠使健康數(shù)據(jù)在公開(kāi)時(shí)不暴露隱私信息。??