文本分類方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)

基本信息

申請(qǐng)?zhí)?/td> CN201810283100.8 申請(qǐng)日 -
公開(公告)號(hào) CN108509596B 公開(公告)日 2021-06-04
申請(qǐng)公布號(hào) CN108509596B 申請(qǐng)公布日 2021-06-04
分類號(hào) G06F16/35;G06N3/04;G06N3/08 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 朱汝維;游永明 申請(qǐng)(專利權(quán))人 廣州市申迪計(jì)算機(jī)系統(tǒng)有限公司
代理機(jī)構(gòu) 廣州華進(jìn)聯(lián)合專利商標(biāo)代理有限公司 代理人 黃曉慶
地址 510600 廣東省廣州市越秀區(qū)中山一路金羊一街2號(hào)1樓
法律狀態(tài) -

摘要

摘要 本申請(qǐng)涉及一種文本分類方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)。方法包括:獲取待分類文本;將所述待分類文本輸入對(duì)訓(xùn)練文本進(jìn)行訓(xùn)練得到的分類模型,獲得所述待分類文本的分類結(jié)果。對(duì)訓(xùn)練文本進(jìn)行訓(xùn)練得到的分類模型的步驟包括:將訓(xùn)練文本中標(biāo)注文本輸入預(yù)設(shè)分類模型,進(jìn)行監(jiān)督對(duì)抗訓(xùn)練,并將訓(xùn)練文本中無標(biāo)注文本輸入監(jiān)督對(duì)抗訓(xùn)練后的所述預(yù)設(shè)分類模型,進(jìn)行無監(jiān)督虛擬對(duì)抗訓(xùn)練,獲得分類模型。分類模型的無監(jiān)督虛擬對(duì)抗過程中可以利用了大量的無標(biāo)注的數(shù)據(jù)作為輸入來進(jìn)行虛擬對(duì)抗訓(xùn)練,而不需要全部使用標(biāo)注數(shù)據(jù)來充當(dāng)預(yù)設(shè)分類模型訓(xùn)練,可以提高訓(xùn)練過程中輸入的數(shù)據(jù)量,且大大減輕對(duì)人工標(biāo)注數(shù)據(jù)量的需求,降低分類模型建立的人力成本。