一種通用場景的敏感密鑰信息識別提取技術(shù)
基本信息
申請?zhí)?/td> | CN202110857157.6 | 申請日 | - |
公開(公告)號 | CN113505280A | 公開(公告)日 | 2021-10-15 |
申請公布號 | CN113505280A | 申請公布日 | 2021-10-15 |
分類號 | G06F16/903(2019.01)I;G06F16/955(2019.01)I;G06F40/289(2020.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 欒尚聰 | 申請(專利權(quán))人 | 全知科技(杭州)有限責(zé)任公司 |
代理機(jī)構(gòu) | 杭州奇炬知識產(chǎn)權(quán)代理事務(wù)所(特殊普通合伙) | 代理人 | 賀心韜 |
地址 | 310000浙江省杭州市余杭區(qū)倉前街道倉興路1號2幢204B室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種通用場景的敏感密鑰信息識別提取技術(shù),具體涉及敏感密鑰識別領(lǐng)域,包括S1:對于任意給定文本,首先獲取構(gòu)成該文本的單詞集;結(jié)合TD?IDF分詞和空格分詞兩種方式,獲得比較準(zhǔn)確的分詞結(jié)果,即給定文本的單詞集;S2:根據(jù)步驟S1中獲取到的單詞集,逐一分析該集合中的單詞,根據(jù)單詞的構(gòu)成字符形態(tài)。本發(fā)明通過將目標(biāo)字符串通過其構(gòu)成字符集分成兩類,通過對應(yīng)類型的信息熵描述目標(biāo)字符串,并根據(jù)實(shí)驗(yàn)基線值評估字符串信息熵,判定目標(biāo)字符串是否屬于敏感密鑰,在分析網(wǎng)絡(luò)流量、項(xiàng)目代碼、日志文件等數(shù)據(jù)時(shí),自動化識別并提取其中的敏感密鑰字符串信息;該技術(shù)可被應(yīng)用于網(wǎng)絡(luò)安全審計(jì)、數(shù)據(jù)泄漏審計(jì)等場景。 |
