基于網(wǎng)頁差異的網(wǎng)頁分析方法及系統(tǒng)

基本信息

申請?zhí)?/td> CN201510917292.X 申請日 -
公開(公告)號 CN105512296A 公開(公告)日 2016-04-20
申請公布號 CN105512296A 申請公布日 2016-04-20
分類號 G06F17/30(2006.01)I;G06K9/62(2006.01)I 分類 計算;推算;計數(shù);
發(fā)明人 馮建興;張云剛;翁時鋒;梁豐;王遵義 申請(專利權)人 寧波中青華云新媒體科技有限公司
代理機構 上海唯源專利代理有限公司 代理人 寧波中青華云新媒體科技有限公司
地址 315199 浙江省寧波市鄞州區(qū)泰康中路666號迪趣大廈8樓
法律狀態(tài) -

摘要

摘要 本發(fā)明提出一種基于網(wǎng)頁差異的網(wǎng)頁分析方法及系統(tǒng),其方法包括:采集需要分析的網(wǎng)頁信息;根據(jù)采集的所述網(wǎng)頁信息的節(jié)點結構,對所述網(wǎng)頁信息進行聚類;根據(jù)所述聚類結果,提取出每一個節(jié)點中,節(jié)點內容變動的可視化網(wǎng)頁元素;對提取出的可視化網(wǎng)頁元素進行分類,以對所述可視化網(wǎng)頁元素進行識別。本發(fā)明可以自動化地實現(xiàn)對網(wǎng)頁內容的分析,無需人工操作,且通過提取可視化的變動網(wǎng)頁元素,實現(xiàn)了針對用戶關心的核心網(wǎng)頁信息的分析,具有針對性強,分析效果好,節(jié)約了人力成本,效率高、解析能力強、通用性強的優(yōu)點。