一種大數(shù)據(jù)安全防護(hù)方法及系統(tǒng)

基本信息

申請?zhí)?/td> CN202010731934.8 申請日 -
公開(公告)號 CN111832024B 公開(公告)日 2021-09-24
申請公布號 CN111832024B 申請公布日 2021-09-24
分類號 G06F21/56;G06F21/62 分類 計算;推算;計數(shù);
發(fā)明人 梁玉娣;梁燕明 申請(專利權(quán))人 東方財富信息股份有限公司
代理機(jī)構(gòu) 上海天協(xié)和誠知識產(chǎn)權(quán)代理事務(wù)所 代理人 吳立斐
地址 201801 上海市嘉定區(qū)寶安公路2999號1幢
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及數(shù)據(jù)安全處理技術(shù)領(lǐng)域,涉及一種大數(shù)據(jù)安全防護(hù)方法及系統(tǒng)。在該方法中,首先提取目標(biāo)腳本文件中的文本特征信息和代碼編寫邏輯,其次通過篩選得到的目標(biāo)信息字段來獲取目標(biāo)腳本文件的待分析源代碼,然后構(gòu)建待分析源代碼的代碼序列并查詢得到目標(biāo)代碼序列從而確定目標(biāo)腳本文件是第一腳本文件還是第二腳本文件。最后基于目標(biāo)腳本文件的類別選用不同的識別方法來識別目標(biāo)腳本文件是否為數(shù)據(jù)爬蟲。本發(fā)明通過對腳本文件的源碼以及編寫邏輯進(jìn)行分析,能夠根據(jù)分析和識別得到的結(jié)果從源碼層面來判斷腳本文件是否為數(shù)據(jù)爬蟲,從而可以快速、準(zhǔn)確地識別出數(shù)據(jù)爬蟲,對數(shù)據(jù)爬蟲進(jìn)行攔截或者銷毀,確保設(shè)備間的數(shù)據(jù)交互的安全性和隱私性。