一種信息挖掘方法及系統(tǒng)
基本信息
申請?zhí)?/td> | CN202110083527.5 | 申請日 | - |
公開(公告)號 | CN112800109A | 公開(公告)日 | 2021-05-14 |
申請公布號 | CN112800109A | 申請公布日 | 2021-05-14 |
分類號 | G06F16/2458;G06F16/28;G06F16/27;G06F16/9535;G06K9/62 | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 侯佳;彭浩 | 申請(專利權(quán))人 | 杭州蜜兔網(wǎng)絡(luò)科技(集團(tuán))有限公司 |
代理機(jī)構(gòu) | 北京漢本專利代理事務(wù)所(普通合伙) | 代理人 | 張詠梅;李婷 |
地址 | 311100 浙江省杭州市余杭區(qū)五常街道西溪八方城8幢809、810室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種信息挖掘方法及系統(tǒng),涉及計算機(jī)技術(shù)領(lǐng)域,包括:獲取用戶數(shù)據(jù),抽取主題信息;根據(jù)主題信息抽取商品,構(gòu)建商品特征庫;抽取人群,標(biāo)注已知用戶人群和未知用戶人群,分別構(gòu)建人群特征庫;將已知人群特征庫、未知人群特征庫分別和商品特征庫關(guān)聯(lián),得到訓(xùn)練樣本數(shù)據(jù)和待預(yù)測數(shù)據(jù);使用訓(xùn)練樣本數(shù)據(jù)訓(xùn)練分類器;將待預(yù)測數(shù)據(jù)輸入到訓(xùn)練好的分類器中,標(biāo)注未知用戶人群對主題信息。本發(fā)明通過解析用戶數(shù)據(jù),可以根據(jù)主題信息自主理解用戶對產(chǎn)品的需求,從海量商品中挑選適宜用戶且質(zhì)量高的商品,提高用戶使用體驗。特別是對于母嬰電商領(lǐng)域,可以通過解析用戶的一些行為,提取對應(yīng)的用戶孩子信息,大大提高了用戶使用體驗。 |
