一種信息挖掘方法及系統(tǒng)

基本信息

申請?zhí)?/td> CN202110083527.5 申請日 -
公開(公告)號 CN112800109A 公開(公告)日 2021-05-14
申請公布號 CN112800109A 申請公布日 2021-05-14
分類號 G06F16/2458;G06F16/28;G06F16/27;G06F16/9535;G06K9/62 分類 計算;推算;計數(shù);
發(fā)明人 侯佳;彭浩 申請(專利權(quán))人 杭州蜜兔網(wǎng)絡(luò)科技(集團(tuán))有限公司
代理機(jī)構(gòu) 北京漢本專利代理事務(wù)所(普通合伙) 代理人 張詠梅;李婷
地址 311100 浙江省杭州市余杭區(qū)五常街道西溪八方城8幢809、810室
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種信息挖掘方法及系統(tǒng),涉及計算機(jī)技術(shù)領(lǐng)域,包括:獲取用戶數(shù)據(jù),抽取主題信息;根據(jù)主題信息抽取商品,構(gòu)建商品特征庫;抽取人群,標(biāo)注已知用戶人群和未知用戶人群,分別構(gòu)建人群特征庫;將已知人群特征庫、未知人群特征庫分別和商品特征庫關(guān)聯(lián),得到訓(xùn)練樣本數(shù)據(jù)和待預(yù)測數(shù)據(jù);使用訓(xùn)練樣本數(shù)據(jù)訓(xùn)練分類器;將待預(yù)測數(shù)據(jù)輸入到訓(xùn)練好的分類器中,標(biāo)注未知用戶人群對主題信息。本發(fā)明通過解析用戶數(shù)據(jù),可以根據(jù)主題信息自主理解用戶對產(chǎn)品的需求,從海量商品中挑選適宜用戶且質(zhì)量高的商品,提高用戶使用體驗。特別是對于母嬰電商領(lǐng)域,可以通過解析用戶的一些行為,提取對應(yīng)的用戶孩子信息,大大提高了用戶使用體驗。