一種基于匹配學(xué)習(xí)的多標(biāo)簽分類學(xué)習(xí)方法
基本信息
申請(qǐng)?zhí)?/td> | CN201810072493.8 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN108256583A | 公開(公告)日 | 2018-07-06 |
申請(qǐng)公布號(hào) | CN108256583A | 申請(qǐng)公布日 | 2018-07-06 |
分類號(hào) | G06K9/62 | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 翟書杰;李晨 | 申請(qǐng)(專利權(quán))人 | 北京東方科諾科技發(fā)展有限公司 |
代理機(jī)構(gòu) | 北京市商泰律師事務(wù)所 | 代理人 | 黃曉軍 |
地址 | 100191 北京市海淀區(qū)花園路2號(hào)牡丹創(chuàng)業(yè)樓2層208A號(hào) | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明提供的基于匹配學(xué)習(xí)的多標(biāo)簽分類學(xué)習(xí)方法,首先對(duì)客戶端數(shù)據(jù)進(jìn)行特征值計(jì)算,得到訓(xùn)練集;設(shè)定訓(xùn)練集中的正負(fù)標(biāo)簽;然后計(jì)算訓(xùn)練集中特征集合的嵌入式表征E;計(jì)算正標(biāo)簽的嵌入式表征Z+和負(fù)標(biāo)簽的嵌入式表征Z?;接著對(duì)E和Z+作損失計(jì)算,對(duì)E與Z?作損失計(jì)算;依據(jù)正負(fù)損失值,采用梯度下降算法對(duì)訓(xùn)練集進(jìn)行模型訓(xùn)練;當(dāng)訓(xùn)練模型的損失值不再下降時(shí),訓(xùn)練結(jié)束,否則再次訓(xùn)練;最后采用測(cè)試集測(cè)試該訓(xùn)練模型。本發(fā)明考慮了長(zhǎng)尾標(biāo)簽對(duì)傳統(tǒng)極大規(guī)模多標(biāo)簽分類模型學(xué)習(xí)的不利影響,提出利用特征集合和標(biāo)簽集合的匹配學(xué)習(xí)方法。此外,為保證模型能夠擴(kuò)展到大規(guī)模數(shù)據(jù)集上,采用梯度下降算法的模型學(xué)習(xí)方式,既可保證模型并行化學(xué)習(xí),還可支持模型在線增量學(xué)習(xí)。 |
