基于深度學(xué)習(xí)的文本分類方法、裝置、服務(wù)器及存儲介質(zhì)

基本信息

申請?zhí)?/td> CN202011203373.0 申請日 -
公開(公告)號 CN112329836A 公開(公告)日 2021-02-05
申請公布號 CN112329836A 申請公布日 2021-02-05
分類號 G06K9/62(2006.01)I; 分類 計算;推算;計數(shù);
發(fā)明人 朱永強;伍文成 申請(專利權(quán))人 成都網(wǎng)安科技發(fā)展有限公司
代理機構(gòu) 成都極刻智慧知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 唐維虎
地址 610000四川省成都市青羊區(qū)廣富路218號G區(qū)6棟C座
法律狀態(tài) -

摘要

摘要 本申請實施例提供一種基于深度學(xué)習(xí)的文本分類方法、裝置、服務(wù)器及存儲介質(zhì),通過按照訓(xùn)練語料分句權(quán)重對訓(xùn)練語料進行關(guān)鍵分句篩選,得到關(guān)鍵分句篩選后的訓(xùn)練語料構(gòu)成的訓(xùn)練樣本集,從而可以按照語言習(xí)慣選擇盡可能保留完整語句與原始語序,通過基于分句權(quán)重選取關(guān)鍵分句用于后續(xù)的文本分類判別訓(xùn)練,可以使得深度學(xué)習(xí)模型能夠?qū)W習(xí)到正常的語義特征。在此基礎(chǔ)上,通過獲取訓(xùn)練樣本集中不同預(yù)設(shè)長度分區(qū)的分區(qū)樣本集,并將每個分區(qū)樣本集分別輸入深度學(xué)習(xí)模型中進行訓(xùn)練,得到不同預(yù)設(shè)長度分區(qū)的文本分類模型,從而采用多長度分區(qū)的多模型訓(xùn)練方式,能夠?qū)Σ煌谋鹃L度的待分類文本自適應(yīng)選取深度學(xué)習(xí)模型進行分類,提高分類精度。??