一種應用離群點檢測算法LOF模型的文本分類方法及裝置
基本信息
申請?zhí)?/td> | CN202111388531.9 | 申請日 | - |
公開(公告)號 | CN114036265A | 公開(公告)日 | 2022-02-11 |
申請公布號 | CN114036265A | 申請公布日 | 2022-02-11 |
分類號 | G06F16/33(2019.01)I;G06F16/35(2019.01)I;G06F40/126(2020.01)I;G06F40/279(2020.01)I;G06F40/30(2020.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 胡加明;李健銓;劉小康 | 申請(專利權)人 | 鼎富智能科技有限公司 |
代理機構 | 北京弘權知識產權代理有限公司 | 代理人 | 郭放;許偉群 |
地址 | 230000安徽省合肥市高新區(qū)習友路3333號A1樓19層-B區(qū) | ||
法律狀態(tài) | - |
摘要
摘要 | 本申請實施例提供了一種應用離群點檢測算法LOF模型的文本分類方法及裝置。該方法包括:獲取包括訓練文本及其對應的類別標簽的訓練數(shù)據集,訓練文本包括以預設比例配置的具有已知標簽的訓練文本和具有其他標簽的訓練文本;使用訓練數(shù)據集訓練分類模型;將具有已知標簽的訓練文本輸入到分類模型中,以獲取具有已知標簽的訓練文本的嵌入表示、中間結果和最終表示向量;根據具有已知標簽的訓練文本的嵌入表示、中間結果和最終表示向量訓練多個LOF模型;根據分類模型和多個LOF模型判斷測試文本是否為未知類別。本申請?zhí)峁┑募夹g方案使得文本分類模型能夠從測試文本中識別出未知類別,避免將未知類別的文本分配到已知的類別標簽,提高了文本分類的準確性。 |
