一種基于互聯(lián)網(wǎng)數(shù)據(jù)形成產(chǎn)品數(shù)據(jù)庫方法和系統(tǒng)

基本信息

申請?zhí)?/td> CN201310292303.0 申請日 -
公開(公告)號 CN103324761B 公開(公告)日 2016-11-30
申請公布號 CN103324761B 申請公布日 2016-11-30
分類號 G06F17/30(2006.01)I 分類 計算;推算;計數(shù);
發(fā)明人 張麗 申請(專利權(quán))人 廣州市尊網(wǎng)商通資訊科技有限公司
代理機構(gòu) 北京超凡志成知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 吳開磊
地址 510670 廣東省廣州市蘿崗區(qū)廣州科學(xué)城科學(xué)大道162號B3區(qū)701房
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種基于互聯(lián)網(wǎng)數(shù)據(jù)形成產(chǎn)品數(shù)據(jù)庫方法和系統(tǒng)。該方法如下:采用主題爬蟲技術(shù),抓取與主題相關(guān)度高于預(yù)設(shè)閾值的網(wǎng)頁數(shù)據(jù);將抓取的網(wǎng)頁數(shù)據(jù)進行結(jié)構(gòu)化存儲;對結(jié)構(gòu)化存儲的網(wǎng)頁數(shù)據(jù)按照產(chǎn)品所屬類別進行自動分類;統(tǒng)計自動分類后的網(wǎng)頁數(shù)據(jù)中產(chǎn)品屬性的出現(xiàn)次數(shù)和出現(xiàn)時間,根據(jù)預(yù)設(shè)的權(quán)重對產(chǎn)品屬性出現(xiàn)次數(shù)和出現(xiàn)時間進行加權(quán)計算,得到產(chǎn)品屬性決策值,根據(jù)產(chǎn)品屬性決策值確定產(chǎn)品屬性排列順序。該系統(tǒng),包括數(shù)據(jù)抓取模塊、結(jié)構(gòu)化存儲模塊、數(shù)據(jù)分類模塊和屬性決策模塊。這種基于互聯(lián)網(wǎng)數(shù)據(jù)形成產(chǎn)品數(shù)據(jù)庫方法和系統(tǒng),用戶無需搜集整理互聯(lián)網(wǎng)中的產(chǎn)品信息便可獲知較為全面的綜合信息;保證了數(shù)據(jù)的實時性,滿足了用戶的實時需求。