一種商品分類方法及系統(tǒng)

基本信息

申請?zhí)?/td> CN201810292145.1 申請日 -
公開(公告)號 CN108595418A 公開(公告)日 2018-09-28
申請公布號 CN108595418A 申請公布日 2018-09-28
分類號 G06F17/27;G06F17/30;G06Q30/06 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 賴秀娟;石謝彬 申請(專利權(quán))人 上海透云物聯(lián)網(wǎng)科技有限公司
代理機(jī)構(gòu) 上海大邦律師事務(wù)所 代理人 上海透云物聯(lián)網(wǎng)科技有限公司
地址 200070 上海市靜安區(qū)光復(fù)路581號23幢
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及一種商品分類方法,包括根據(jù)待分類商品名稱爬取該商品特征值信息,并將商品特征值信息進(jìn)行自動分詞;根據(jù)商品分類爬取該商品分類下的商品特征值信息,并將商品特征值信息進(jìn)行自動分詞;將上述所有分詞進(jìn)行合并,形成一個(gè)集合;計(jì)算待分類商品特征值信息的每個(gè)詞在集合中的詞頻,并將其轉(zhuǎn)化為向量A;計(jì)算商品分類下的商品特征值信息的每分詞在集合中的詞頻,并將其轉(zhuǎn)化為向量B;通過測量向量A與向量B之間表示相差的夾角大小的余弦值來判斷待分類商品和商品分類是否相似。本發(fā)明根據(jù)現(xiàn)有商品名稱和商品分類的特征信息,在原有詞匯上擴(kuò)展其商品的描述內(nèi)容,進(jìn)行語意相似度比對,以提高商品名稱分類的可辨識度,運(yùn)算速度快,效率高。