一種網頁篡改檢測模型的訓練、應用方法及裝置

基本信息

申請?zhí)?/td> CN202111506272.5 申請日 -
公開(公告)號 CN114201606A 公開(公告)日 2022-03-18
申請公布號 CN114201606A 申請公布日 2022-03-18
分類號 G06F16/35(2019.01)I;G06F40/30(2020.01)I;G06F16/951(2019.01)I;G06F21/56(2013.01)I;G06F21/64(2013.01)I;H04L9/40(2022.01)I 分類 計算;推算;計數(shù);
發(fā)明人 姚劍文;潘季明 申請(專利權)人 北京天融信科技有限公司
代理機構 北京超凡宏宇專利代理事務所(特殊普通合伙) 代理人 楊奇松
地址 100000北京市海淀區(qū)上地東路1號院3號樓四層
法律狀態(tài) -

摘要

摘要 本申請?zhí)峁┮环N網頁篡改檢測模型的訓練、應用方法及裝置,該網頁篡改檢測模型的訓練方法包括:獲取多個網頁中的description字段內容和text字段內容,并進行數(shù)據(jù)清洗處理,得到description純凈內容和text純凈內容;根據(jù)預設的Bert模型對description純凈內容和text純凈內容進行編碼,得到編碼字段;獲取與編碼字段相匹配的語義矛盾檢測結果;根據(jù)語義矛盾檢測結果、description純凈內容、text純凈內容和預設訓練條件進行訓練,得到網頁篡改檢測模型??梢?,實施這種實施方式,能夠基于網頁中上下文語義矛盾性訓練出一種高精度地網頁篡改檢測模型,從而使得該網頁篡改檢測模型能夠批量對網頁進行篡改檢測,從而能夠使得用戶認出篡改網頁并對其進行安全防范。