一種數(shù)據(jù)庫構(gòu)建的數(shù)據(jù)挖掘方法、裝置及服務(wù)器

基本信息

申請?zhí)?/td> CN202010335683.1 申請日 -
公開(公告)號 CN111460006B 公開(公告)日 2020-07-28
申請公布號 CN111460006B 申請公布日 2020-07-28
分類號 G06F16/2458(2019.01)I 分類 計算;推算;計數(shù);
發(fā)明人 梁成敏;梁燕露;楊樂忠 申請(專利權(quán))人 廣東佳邦信息咨詢股份有限公司
代理機構(gòu) 深圳至誠化育知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 劉英
地址 528000廣東省佛山市順德區(qū)大良鳳山東路6號德業(yè)大廈7樓706號
法律狀態(tài) -

摘要

摘要 本發(fā)明實施例涉及數(shù)據(jù)處理技術(shù)領(lǐng)域,具體而言,涉及一種數(shù)據(jù)庫構(gòu)建的數(shù)據(jù)挖掘方法、裝置及服務(wù)器。該方法能夠直接根據(jù)統(tǒng)計得到的頁面節(jié)點的特征數(shù)據(jù)的調(diào)用次數(shù)確定出目標(biāo)頁面節(jié)點,無需對特征數(shù)據(jù)進行相似度判斷,提高了確定目標(biāo)頁面節(jié)點的實時性,能夠?qū)⒕W(wǎng)絡(luò)爬蟲附著于數(shù)據(jù)挖掘節(jié)點的爬取腳本進行簡化,減輕后續(xù)對數(shù)據(jù)挖掘節(jié)點進行挖掘的計算負(fù)荷,能夠?qū)崿F(xiàn)爬取進程和數(shù)據(jù)存儲進程的邏輯切換,提高基于第二位置區(qū)域進行數(shù)據(jù)挖掘的效率和準(zhǔn)確性,從而提高數(shù)據(jù)收集和分析的效率,確保數(shù)據(jù)收集和分析的實時性。??