一種通用場景的敏感密鑰信息識別提取技術(shù)

基本信息

申請?zhí)?/td> CN202110857157.6 申請日 -
公開(公告)號 CN113505280A 公開(公告)日 2021-10-15
申請公布號 CN113505280A 申請公布日 2021-10-15
分類號 G06F16/903(2019.01)I;G06F16/955(2019.01)I;G06F40/289(2020.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 欒尚聰 申請(專利權(quán))人 全知科技(杭州)有限責(zé)任公司
代理機(jī)構(gòu) 杭州奇炬知識產(chǎn)權(quán)代理事務(wù)所(特殊普通合伙) 代理人 賀心韜
地址 310000浙江省杭州市余杭區(qū)倉前街道倉興路1號2幢204B室
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種通用場景的敏感密鑰信息識別提取技術(shù),具體涉及敏感密鑰識別領(lǐng)域,包括S1:對于任意給定文本,首先獲取構(gòu)成該文本的單詞集;結(jié)合TD?IDF分詞和空格分詞兩種方式,獲得比較準(zhǔn)確的分詞結(jié)果,即給定文本的單詞集;S2:根據(jù)步驟S1中獲取到的單詞集,逐一分析該集合中的單詞,根據(jù)單詞的構(gòu)成字符形態(tài)。本發(fā)明通過將目標(biāo)字符串通過其構(gòu)成字符集分成兩類,通過對應(yīng)類型的信息熵描述目標(biāo)字符串,并根據(jù)實(shí)驗(yàn)基線值評估字符串信息熵,判定目標(biāo)字符串是否屬于敏感密鑰,在分析網(wǎng)絡(luò)流量、項(xiàng)目代碼、日志文件等數(shù)據(jù)時(shí),自動化識別并提取其中的敏感密鑰字符串信息;該技術(shù)可被應(yīng)用于網(wǎng)絡(luò)安全審計(jì)、數(shù)據(jù)泄漏審計(jì)等場景。