基于網(wǎng)頁差異的網(wǎng)頁分析方法及系統(tǒng)

基本信息

申請?zhí)?/td> CN201510917292.X 申請日 -
公開(公告)號 CN105512296B 公開(公告)日 2019-01-22
申請公布號 CN105512296B 申請公布日 2019-01-22
分類號 G06F16/9535;G06F16/906;G06K9/62 分類 計算;推算;計數(shù);
發(fā)明人 馮建興;張云剛;翁時鋒;梁豐;王遵義 申請(專利權(quán))人 寧波中青華云新媒體科技有限公司
代理機(jī)構(gòu) 上海唯源專利代理有限公司 代理人 寧波中青華云新媒體科技有限公司
地址 315199 浙江省寧波市鄞州區(qū)泰康中路666號迪趣大廈8樓
法律狀態(tài) -

摘要

摘要 本發(fā)明提出一種基于網(wǎng)頁差異的網(wǎng)頁分析方法及系統(tǒng),其方法包括:采集需要分析的網(wǎng)頁信息;根據(jù)采集的所述網(wǎng)頁信息的節(jié)點結(jié)構(gòu),對所述網(wǎng)頁信息進(jìn)行聚類;根據(jù)所述聚類結(jié)果,提取出每一個節(jié)點中,節(jié)點內(nèi)容變動的可視化網(wǎng)頁元素;對提取出的可視化網(wǎng)頁元素進(jìn)行分類,以對所述可視化網(wǎng)頁元素進(jìn)行識別。本發(fā)明可以自動化地實現(xiàn)對網(wǎng)頁內(nèi)容的分析,無需人工操作,且通過提取可視化的變動網(wǎng)頁元素,實現(xiàn)了針對用戶關(guān)心的核心網(wǎng)頁信息的分析,具有針對性強,分析效果好,節(jié)約了人力成本,效率高、解析能力強、通用性強的優(yōu)點。