一種基于匹配學(xué)習(xí)的多標(biāo)簽分類學(xué)習(xí)方法

基本信息

申請?zhí)?/td> CN201810072493.8 申請日 -
公開(公告)號 CN108256583A 公開(公告)日 2018-07-06
申請公布號 CN108256583A 申請公布日 2018-07-06
分類號 G06K9/62 分類 計算;推算;計數(shù);
發(fā)明人 翟書杰;李晨 申請(專利權(quán))人 北京東方科諾科技發(fā)展有限公司
代理機(jī)構(gòu) 北京市商泰律師事務(wù)所 代理人 黃曉軍
地址 100191 北京市海淀區(qū)花園路2號牡丹創(chuàng)業(yè)樓2層208A號
法律狀態(tài) -

摘要

摘要 本發(fā)明提供的基于匹配學(xué)習(xí)的多標(biāo)簽分類學(xué)習(xí)方法,首先對客戶端數(shù)據(jù)進(jìn)行特征值計算,得到訓(xùn)練集;設(shè)定訓(xùn)練集中的正負(fù)標(biāo)簽;然后計算訓(xùn)練集中特征集合的嵌入式表征E;計算正標(biāo)簽的嵌入式表征Z+和負(fù)標(biāo)簽的嵌入式表征Z?;接著對E和Z+作損失計算,對E與Z?作損失計算;依據(jù)正負(fù)損失值,采用梯度下降算法對訓(xùn)練集進(jìn)行模型訓(xùn)練;當(dāng)訓(xùn)練模型的損失值不再下降時,訓(xùn)練結(jié)束,否則再次訓(xùn)練;最后采用測試集測試該訓(xùn)練模型。本發(fā)明考慮了長尾標(biāo)簽對傳統(tǒng)極大規(guī)模多標(biāo)簽分類模型學(xué)習(xí)的不利影響,提出利用特征集合和標(biāo)簽集合的匹配學(xué)習(xí)方法。此外,為保證模型能夠擴(kuò)展到大規(guī)模數(shù)據(jù)集上,采用梯度下降算法的模型學(xué)習(xí)方式,既可保證模型并行化學(xué)習(xí),還可支持模型在線增量學(xué)習(xí)。