數(shù)據(jù)庫敏感數(shù)據(jù)識別方法及裝置

基本信息

申請?zhí)?/td> CN202111162248.4 申請日 -
公開(公告)號 CN113919352A 公開(公告)日 2022-01-11
申請公布號 CN113919352A 申請公布日 2022-01-11
分類號 G06F40/295(2020.01)I;G06F40/253(2020.01)I;G06F40/216(2020.01)I;G06V10/74(2022.01)I;G06V10/82(2022.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 肖增輝 申請(專利權(quán))人 杭州玖玖盾信息科技有限公司
代理機(jī)構(gòu) 杭州華知專利事務(wù)所(普通合伙) 代理人 束曉前
地址 310030浙江省杭州市余杭區(qū)余杭街道文一西路1818-2號5幢308室
法律狀態(tài) -

摘要

摘要 本申請?zhí)峁┝艘环N數(shù)據(jù)庫敏感數(shù)據(jù)識別方法及裝置,涉及計(jì)算機(jī)技術(shù)領(lǐng)域。包括:確定新的敏感類別以及所述新的敏感類別對應(yīng)的敏感數(shù)據(jù)字段;將所述敏感數(shù)據(jù)字段與所述預(yù)留敏感數(shù)據(jù)集進(jìn)行合并得到新的訓(xùn)練數(shù)據(jù)集;基于所述新的訓(xùn)練數(shù)據(jù)集對所述預(yù)訓(xùn)練的命名實(shí)體識別模型進(jìn)行訓(xùn)練得到新的命名實(shí)體識別模型,并更新所述預(yù)先確定的敏感類別特征表得到新的敏感類別特征表,以便于基于所述新的命名實(shí)體識別模型和所述新的敏感類別特征表進(jìn)行數(shù)據(jù)庫敏感數(shù)據(jù)識別。以此可以對已經(jīng)訓(xùn)練好的命名實(shí)體識別模型的識別范圍進(jìn)行擴(kuò)展,大幅度增加了模型應(yīng)用的靈活性,提高了模型在不同敏感識別場景下的適配效率。