一種基于相似度計算的網(wǎng)頁變更監(jiān)測方法和系統(tǒng)

基本信息

申請?zhí)?/td> CN201611182671.X 申請日 -
公開(公告)號 CN106599242B 公開(公告)日 2019-03-26
申請公布號 CN106599242B 申請公布日 2019-03-26
分類號 G06F16/951(2019.01)I; G06F16/958(2019.01)I; G06F21/55(2013.01)I; G06F21/56(2013.01)I 分類 計算;推算;計數(shù);
發(fā)明人 劉坤朋; 鄭杭; 練軍 申請(專利權(quán))人 福建六壬網(wǎng)安股份有限公司
代理機構(gòu) 福州科揚專利事務(wù)所 代理人 福建六壬網(wǎng)安股份有限公司
地址 350015 福建省福州市馬尾區(qū)馬尾圖書館第四層(自貿(mào)試驗區(qū)內(nèi))
法律狀態(tài) -

摘要

摘要 本發(fā)明的一種基于相似度計算的網(wǎng)頁變更監(jiān)測方法和系統(tǒng),使用網(wǎng)絡(luò)爬蟲技術(shù)將網(wǎng)頁內(nèi)容保存到本地,在設(shè)定的時間間隔再次獲取網(wǎng)頁內(nèi)容,利用模糊哈希算法與本地保存的頁面內(nèi)容相似度進行比較??梢宰远x網(wǎng)頁內(nèi)容屬性,內(nèi)容不會改變的網(wǎng)頁內(nèi)容,監(jiān)測步驟較為簡潔,監(jiān)測效率高。對于內(nèi)容可改變的網(wǎng)頁內(nèi)容,進一步進行差異分析,識別字符或者圖片的篡改,可以第一時間準確識別網(wǎng)頁內(nèi)容是被篡改還是正常的更新,提高網(wǎng)頁內(nèi)容的安全性。