一種文本分類方法及裝置

基本信息

申請?zhí)?/td> CN202111199675.X 申請日 -
公開(公告)號 CN113849653A 公開(公告)日 2021-12-28
申請公布號 CN113849653A 申請公布日 2021-12-28
分類號 G06F16/35(2019.01)I;G06F16/33(2019.01)I;G06F40/194(2020.01)I;G06F40/279(2020.01)I;G06K9/62(2006.01)I 分類 計算;推算;計數(shù);
發(fā)明人 胡加明;李健銓;劉小康;穆晶晶 申請(專利權(quán))人 鼎富智能科技有限公司
代理機構(gòu) 北京弘權(quán)知識產(chǎn)權(quán)代理有限公司 代理人 郭放;許偉群
地址 230000安徽省合肥市高新區(qū)習友路3333號A1樓19層-B區(qū)
法律狀態(tài) -

摘要

摘要 本申請實施例提供了一種文本分類方法及裝置。其中,該方法包括:獲取訓練文本的表示向量和類別標簽的標簽向量;將訓練文本向其對應(yīng)的類別標簽聚攏,以形成類別簇,并學習每個類別簇的決策邊界;確定待分類文本是否位于全部類別簇的決策邊界之外;如果待分類文本位于全部類別簇的邊界之外,則待分類文本為未知類別;如果待分類文本不位于全部類別簇的邊界之外,則與待分類文本相似度最大的類別標簽所對應(yīng)的類別為待分類文本的類別。這樣,當有待分類文本位于全部類別簇的邊界之外時,本申請實施例能夠?qū)⒋诸愇谋咀R別為未知意圖,解決了目前的分類模型無法識別未知意圖,以及將未知意圖的文本分類到錯誤類別的問題。