基于深度學習的文本分類方法、裝置、服務器及存儲介質
基本信息
申請?zhí)?/td> | CN202011203373.0 | 申請日 | - |
公開(公告)號 | CN112329836A | 公開(公告)日 | 2021-02-05 |
申請公布號 | CN112329836A | 申請公布日 | 2021-02-05 |
分類號 | G06K9/62(2006.01)I; | 分類 | 計算;推算;計數; |
發(fā)明人 | 朱永強;伍文成 | 申請(專利權)人 | 成都網安科技發(fā)展有限公司 |
代理機構 | 成都極刻智慧知識產權代理事務所(普通合伙) | 代理人 | 唐維虎 |
地址 | 610000四川省成都市青羊區(qū)廣富路218號G區(qū)6棟C座 | ||
法律狀態(tài) | - |
摘要
摘要 | 本申請實施例提供一種基于深度學習的文本分類方法、裝置、服務器及存儲介質,通過按照訓練語料分句權重對訓練語料進行關鍵分句篩選,得到關鍵分句篩選后的訓練語料構成的訓練樣本集,從而可以按照語言習慣選擇盡可能保留完整語句與原始語序,通過基于分句權重選取關鍵分句用于后續(xù)的文本分類判別訓練,可以使得深度學習模型能夠學習到正常的語義特征。在此基礎上,通過獲取訓練樣本集中不同預設長度分區(qū)的分區(qū)樣本集,并將每個分區(qū)樣本集分別輸入深度學習模型中進行訓練,得到不同預設長度分區(qū)的文本分類模型,從而采用多長度分區(qū)的多模型訓練方式,能夠對不同文本長度的待分類文本自適應選取深度學習模型進行分類,提高分類精度。?? |
