基于深度學(xué)習(xí)的文本分類方法、裝置、服務(wù)器及存儲介質(zhì)
基本信息
申請?zhí)?/td> | CN202011203373.0 | 申請日 | - |
公開(公告)號 | CN112329836A | 公開(公告)日 | 2021-02-05 |
申請公布號 | CN112329836A | 申請公布日 | 2021-02-05 |
分類號 | G06K9/62(2006.01)I; | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 朱永強;伍文成 | 申請(專利權(quán))人 | 成都網(wǎng)安科技發(fā)展有限公司 |
代理機構(gòu) | 成都極刻智慧知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) | 代理人 | 唐維虎 |
地址 | 610000四川省成都市青羊區(qū)廣富路218號G區(qū)6棟C座 | ||
法律狀態(tài) | - |
摘要
摘要 | 本申請實施例提供一種基于深度學(xué)習(xí)的文本分類方法、裝置、服務(wù)器及存儲介質(zhì),通過按照訓(xùn)練語料分句權(quán)重對訓(xùn)練語料進行關(guān)鍵分句篩選,得到關(guān)鍵分句篩選后的訓(xùn)練語料構(gòu)成的訓(xùn)練樣本集,從而可以按照語言習(xí)慣選擇盡可能保留完整語句與原始語序,通過基于分句權(quán)重選取關(guān)鍵分句用于后續(xù)的文本分類判別訓(xùn)練,可以使得深度學(xué)習(xí)模型能夠?qū)W習(xí)到正常的語義特征。在此基礎(chǔ)上,通過獲取訓(xùn)練樣本集中不同預(yù)設(shè)長度分區(qū)的分區(qū)樣本集,并將每個分區(qū)樣本集分別輸入深度學(xué)習(xí)模型中進行訓(xùn)練,得到不同預(yù)設(shè)長度分區(qū)的文本分類模型,從而采用多長度分區(qū)的多模型訓(xùn)練方式,能夠?qū)Σ煌谋鹃L度的待分類文本自適應(yīng)選取深度學(xué)習(xí)模型進行分類,提高分類精度。?? |
