一種文本分類方法及裝置
基本信息
申請(qǐng)?zhí)?/td> | CN202111386639.4 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN114048290A | 公開(公告)日 | 2022-02-15 |
申請(qǐng)公布號(hào) | CN114048290A | 申請(qǐng)公布日 | 2022-02-15 |
分類號(hào) | G06F16/33(2019.01)I;G06F16/35(2019.01)I;G06F40/194(2020.01)I;G06F40/30(2020.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 胡加明;李健銓;劉小康 | 申請(qǐng)(專利權(quán))人 | 鼎富智能科技有限公司 |
代理機(jī)構(gòu) | 北京弘權(quán)知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | 郭放;許偉群 |
地址 | 230000安徽省合肥市高新區(qū)習(xí)友路3333號(hào)A1樓19層-B區(qū) | ||
法律狀態(tài) | - |
摘要
摘要 | 本申請(qǐng)實(shí)施例提供了一種文本分類方法及裝置。其中,該方法包括:獲取文本的文本表示向量與標(biāo)簽矩陣之間的相似度向量;獲取從相似度向量到文本對(duì)應(yīng)的標(biāo)簽之間的第一損失函數(shù);對(duì)文本表示向量進(jìn)行線性映射,得到文本的對(duì)抗向量;獲取從對(duì)抗向量到文本對(duì)應(yīng)的標(biāo)簽之間的第二損失函數(shù);將第一損失函數(shù)和第二損失函數(shù)的結(jié)合作為文本分類模型的總損失函數(shù),以訓(xùn)練文本分類模型;根據(jù)訓(xùn)練后的文本分類模型對(duì)未知文本進(jìn)行分類。本申請(qǐng)實(shí)施例的技術(shù)方案,通過引入對(duì)抗訓(xùn)練使文本分類模型不再專注于學(xué)習(xí)某個(gè)類別的簡單特征,而是學(xué)習(xí)到各個(gè)類別的共性特征,使文本分類模型學(xué)習(xí)到類別更深層次的表示,提高了文本分類模型的泛化性和魯棒性。 |
