Web系統(tǒng)的數(shù)據(jù)資源模型化提取方法、裝置以及設(shè)備
基本信息
申請?zhí)?/td> | CN201910295549.0 | 申請日 | - |
公開(公告)號 | CN110147477A | 公開(公告)日 | 2019-08-20 |
申請公布號 | CN110147477A | 申請公布日 | 2019-08-20 |
分類號 | G06F16/951;G06F17/22;G06F3/0484 | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 張穎;徐經(jīng)緯;黃罡;蘇星;蔡斯博 | 申請(專利權(quán))人 | 因特??萍加邢薰?/a> |
代理機(jī)構(gòu) | 北京潤澤恒知識產(chǎn)權(quán)代理有限公司 | 代理人 | 北京因特睿軟件有限公司 |
地址 | 100080 北京市海淀區(qū)北四環(huán)西路65號海淀新技術(shù)大廈16層1608室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明涉及通信技術(shù)領(lǐng)域,提供了一種Web系統(tǒng)的數(shù)據(jù)資源模型化提取方法、裝置以及設(shè)備,旨在解決現(xiàn)有提取方法存在具有較高技術(shù)門檻、提取方法復(fù)雜的問題。所述Web系統(tǒng)的數(shù)據(jù)資源模型化提取方法包括:確定用戶對Web網(wǎng)頁的標(biāo)記區(qū)域;檢測所述標(biāo)記區(qū)域?qū)?yīng)的Web數(shù)據(jù)的頁面結(jié)構(gòu)類型;獲取與所述頁面結(jié)構(gòu)類型相匹配的提取模型;根據(jù)所述提取模型的模型結(jié)構(gòu),結(jié)構(gòu)化地輸出所述Web數(shù)據(jù)。使用所述方法后,對于用戶,僅需對網(wǎng)頁上的某一區(qū)域進(jìn)行標(biāo)記,客戶端會自動進(jìn)行上述檢測頁面結(jié)構(gòu)類型、獲取提取模型、結(jié)構(gòu)化地輸出Web數(shù)據(jù)等步驟,用戶不需要每次在提取數(shù)據(jù)前進(jìn)行編輯代碼或編輯提取規(guī)則等操作,也不需要在每次提取后手動對數(shù)據(jù)進(jìn)行結(jié)構(gòu)組織。 |
