一種數(shù)據(jù)挖掘系統(tǒng)及方法

基本信息

申請?zhí)?/td> CN201410126187.X 申請日 -
公開(公告)號(hào) CN103870595A 公開(公告)日 2014-06-18
申請公布號(hào) CN103870595A 申請公布日 2014-06-18
分類號(hào) G06F17/30(2006.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 李飛 申請(專利權(quán))人 深圳市科盾科技有限公司
代理機(jī)構(gòu) - 代理人 -
地址 518017 廣東省深圳市福田區(qū)福強(qiáng)路益田花園27-28棟裙樓中間D區(qū)裙樓二層0202
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及一種數(shù)據(jù)挖掘系統(tǒng),包括多個(gè)數(shù)據(jù)采集模塊、數(shù)據(jù)分析模塊、關(guān)系型數(shù)據(jù)庫和非關(guān)系型數(shù)據(jù)庫以及數(shù)據(jù)挖掘模塊;還提供一種數(shù)據(jù)挖掘方法,該方法包括S1:多個(gè)數(shù)據(jù)采集模塊采集用戶瀏覽的網(wǎng)頁數(shù)據(jù);S2:數(shù)據(jù)分析模塊采用決策樹或神經(jīng)網(wǎng)絡(luò)方法對用戶瀏覽的網(wǎng)頁數(shù)據(jù)進(jìn)行分析以及整合;S3:根據(jù)數(shù)據(jù)挖掘需求,數(shù)據(jù)挖掘模塊對數(shù)據(jù)分析模塊分析以及整合的數(shù)據(jù)信息進(jìn)行相關(guān)挖掘,并形成相關(guān)目標(biāo)文檔;S4:對形成的目標(biāo)文檔進(jìn)行處理,并根據(jù)簡單匹配式、模糊匹配式以及段落理解式生成索引存放在非關(guān)系數(shù)據(jù)庫中。本發(fā)明的有益效果在于,本發(fā)明提供一種中文分詞效率高以及挖掘效率高的數(shù)據(jù)挖掘系統(tǒng)和方法。