一種基于TFIDF模型的積分系統(tǒng)數(shù)據(jù)脫敏方法和系統(tǒng)

基本信息

申請?zhí)?/td> CN202010975494.0 申請日 -
公開(公告)號 CN112115510A 公開(公告)日 2020-12-22
申請公布號 CN112115510A 申請公布日 2020-12-22
分類號 G06F21/62(2013.01)I 分類 計算;推算;計數(shù);
發(fā)明人 康為;張明杰;單文杰 申請(專利權)人 翼集分(上海)數(shù)字科技有限公司
代理機構 - 代理人 -
地址 200060上海市普陀區(qū)江寧路1207號
法律狀態(tài) -

摘要

摘要 本發(fā)明提供了一種基于TFIDF模型的積分系統(tǒng)數(shù)據(jù)脫敏方法和系統(tǒng)。在需要共享獲取積分系統(tǒng)數(shù)據(jù)時,對獲取數(shù)據(jù)進行基礎分詞處理,并調用TFIDF模型,基于關鍵詞典的學習訓練,對逐條分詞進行相似度判斷,超出設定閥值的,進行脫敏過濾處理,并將脫敏過濾后的數(shù)據(jù)進行輸出共享。本發(fā)明方法和系統(tǒng)包括數(shù)據(jù)脫敏處理模塊、TFIDF模型模塊、數(shù)據(jù)詞典模塊和數(shù)據(jù)脫敏管理模塊。??