一種數(shù)據(jù)庫構(gòu)建的數(shù)據(jù)挖掘方法、裝置及服務(wù)器
基本信息
申請(qǐng)?zhí)?/td> | CN202010335683.1 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN111460006A | 公開(公告)日 | 2020-07-28 |
申請(qǐng)公布號(hào) | CN111460006A | 申請(qǐng)公布日 | 2020-07-28 |
分類號(hào) | G06F16/2458(2019.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 梁成敏;梁燕露;楊樂忠 | 申請(qǐng)(專利權(quán))人 | 廣東佳邦信息咨詢股份有限公司 |
代理機(jī)構(gòu) | - | 代理人 | - |
地址 | 510700廣東省廣州市黃埔區(qū)科匯一街16號(hào)601房90青創(chuàng)社辦公卡位A607 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明實(shí)施例涉及數(shù)據(jù)處理技術(shù)領(lǐng)域,具體而言,涉及一種數(shù)據(jù)庫構(gòu)建的數(shù)據(jù)挖掘方法、裝置及服務(wù)器。該方法能夠直接根據(jù)統(tǒng)計(jì)得到的頁面節(jié)點(diǎn)的特征數(shù)據(jù)的調(diào)用次數(shù)確定出目標(biāo)頁面節(jié)點(diǎn),無需對(duì)特征數(shù)據(jù)進(jìn)行相似度判斷,提高了確定目標(biāo)頁面節(jié)點(diǎn)的實(shí)時(shí)性,能夠?qū)⒕W(wǎng)絡(luò)爬蟲附著于數(shù)據(jù)挖掘節(jié)點(diǎn)的爬取腳本進(jìn)行簡(jiǎn)化,減輕后續(xù)對(duì)數(shù)據(jù)挖掘節(jié)點(diǎn)進(jìn)行挖掘的計(jì)算負(fù)荷,能夠?qū)崿F(xiàn)爬取進(jìn)程和數(shù)據(jù)存儲(chǔ)進(jìn)程的邏輯切換,提高基于第二位置區(qū)域進(jìn)行數(shù)據(jù)挖掘的效率和準(zhǔn)確性,從而提高數(shù)據(jù)收集和分析的效率,確保數(shù)據(jù)收集和分析的實(shí)時(shí)性。?? |
