Web系統(tǒng)的數(shù)據資源模型化提取方法、裝置以及設備
基本信息
申請?zhí)?/td> | CN201910295549.0 | 申請日 | - |
公開(公告)號 | CN110147477B | 公開(公告)日 | 2021-08-27 |
申請公布號 | CN110147477B | 申請公布日 | 2021-08-27 |
分類號 | G06F16/951;G06F40/143;G06F3/0484 | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 張穎;徐經緯;黃罡;蘇星;蔡斯博 | 申請(專利權)人 | 因特睿科技有限公司 |
代理機構 | 北京潤澤恒知識產權代理有限公司 | 代理人 | 莎日娜 |
地址 | 100080 北京市海淀區(qū)北四環(huán)西路65號海淀新技術大廈16層1608室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明涉及通信技術領域,提供了一種Web系統(tǒng)的數(shù)據資源模型化提取方法、裝置以及設備,旨在解決現(xiàn)有提取方法存在具有較高技術門檻、提取方法復雜的問題。所述Web系統(tǒng)的數(shù)據資源模型化提取方法包括:確定用戶對Web網頁的標記區(qū)域;檢測所述標記區(qū)域對應的Web數(shù)據的頁面結構類型;獲取與所述頁面結構類型相匹配的提取模型;根據所述提取模型的模型結構,結構化地輸出所述Web數(shù)據。使用所述方法后,對于用戶,僅需對網頁上的某一區(qū)域進行標記,客戶端會自動進行上述檢測頁面結構類型、獲取提取模型、結構化地輸出Web數(shù)據等步驟,用戶不需要每次在提取數(shù)據前進行編輯代碼或編輯提取規(guī)則等操作,也不需要在每次提取后手動對數(shù)據進行結構組織。 |
