一種基于互聯(lián)網(wǎng)數(shù)據(jù)形成產(chǎn)品數(shù)據(jù)庫方法和系統(tǒng)
基本信息
申請?zhí)?/td> | CN201310292303.0 | 申請日 | - |
公開(公告)號 | CN103324761A | 公開(公告)日 | 2013-09-25 |
申請公布號 | CN103324761A | 申請公布日 | 2013-09-25 |
分類號 | G06F17/30(2006.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 張麗 | 申請(專利權(quán))人 | 廣州市尊網(wǎng)商通資訊科技有限公司 |
代理機(jī)構(gòu) | 北京超凡志成知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) | 代理人 | 吳開磊 |
地址 | 510670 廣東省廣州市蘿崗區(qū)廣州科學(xué)城科學(xué)大道162號B3區(qū)701房 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種基于互聯(lián)網(wǎng)數(shù)據(jù)形成產(chǎn)品數(shù)據(jù)庫方法和系統(tǒng)。該方法如下:采用主題爬蟲技術(shù),抓取與主題相關(guān)度高于預(yù)設(shè)閾值的網(wǎng)頁數(shù)據(jù);將抓取的網(wǎng)頁數(shù)據(jù)進(jìn)行結(jié)構(gòu)化存儲;對結(jié)構(gòu)化存儲的網(wǎng)頁數(shù)據(jù)按照產(chǎn)品所屬類別進(jìn)行自動分類;統(tǒng)計(jì)自動分類后的網(wǎng)頁數(shù)據(jù)中產(chǎn)品屬性的出現(xiàn)次數(shù)和出現(xiàn)時(shí)間,根據(jù)預(yù)設(shè)的權(quán)重對產(chǎn)品屬性出現(xiàn)次數(shù)和出現(xiàn)時(shí)間進(jìn)行加權(quán)計(jì)算,得到產(chǎn)品屬性決策值,根據(jù)產(chǎn)品屬性決策值確定產(chǎn)品屬性排列順序。該系統(tǒng),包括數(shù)據(jù)抓取模塊、結(jié)構(gòu)化存儲模塊、數(shù)據(jù)分類模塊和屬性決策模塊。這種基于互聯(lián)網(wǎng)數(shù)據(jù)形成產(chǎn)品數(shù)據(jù)庫方法和系統(tǒng),用戶無需搜集整理互聯(lián)網(wǎng)中的產(chǎn)品信息便可獲知較為全面的綜合信息;保證了數(shù)據(jù)的實(shí)時(shí)性,滿足了用戶的實(shí)時(shí)需求。 |
