一種基于相似度計(jì)算的網(wǎng)頁(yè)變更監(jiān)測(cè)方法和系統(tǒng)

基本信息

申請(qǐng)?zhí)?/td> CN201611182671.X 申請(qǐng)日 -
公開(公告)號(hào) CN106599242B 公開(公告)日 2019-03-26
申請(qǐng)公布號(hào) CN106599242B 申請(qǐng)公布日 2019-03-26
分類號(hào) G06F16/951(2019.01)I; G06F16/958(2019.01)I; G06F21/55(2013.01)I; G06F21/56(2013.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 劉坤朋; 鄭杭; 練軍 申請(qǐng)(專利權(quán))人 福建六壬網(wǎng)安股份有限公司
代理機(jī)構(gòu) 福州科揚(yáng)專利事務(wù)所 代理人 福建六壬網(wǎng)安股份有限公司
地址 350015 福建省福州市馬尾區(qū)馬尾圖書館第四層(自貿(mào)試驗(yàn)區(qū)內(nèi))
法律狀態(tài) -

摘要

摘要 本發(fā)明的一種基于相似度計(jì)算的網(wǎng)頁(yè)變更監(jiān)測(cè)方法和系統(tǒng),使用網(wǎng)絡(luò)爬蟲技術(shù)將網(wǎng)頁(yè)內(nèi)容保存到本地,在設(shè)定的時(shí)間間隔再次獲取網(wǎng)頁(yè)內(nèi)容,利用模糊哈希算法與本地保存的頁(yè)面內(nèi)容相似度進(jìn)行比較。可以自定義網(wǎng)頁(yè)內(nèi)容屬性,內(nèi)容不會(huì)改變的網(wǎng)頁(yè)內(nèi)容,監(jiān)測(cè)步驟較為簡(jiǎn)潔,監(jiān)測(cè)效率高。對(duì)于內(nèi)容可改變的網(wǎng)頁(yè)內(nèi)容,進(jìn)一步進(jìn)行差異分析,識(shí)別字符或者圖片的篡改,可以第一時(shí)間準(zhǔn)確識(shí)別網(wǎng)頁(yè)內(nèi)容是被篡改還是正常的更新,提高網(wǎng)頁(yè)內(nèi)容的安全性。