一種文本分類方法、裝置、電子設備及存儲介質(zhì)

基本信息

申請?zhí)?/td> CN201910593186.9 申請日 -
公開(公告)號 CN110399487B 公開(公告)日 2021-09-28
申請公布號 CN110399487B 申請公布日 2021-09-28
分類號 G06F16/35(2019.01)I;G06F16/33(2019.01)I 分類 計算;推算;計數(shù);
發(fā)明人 徐波 申請(專利權)人 廣東利為網(wǎng)絡科技有限公司
代理機構 廣州三環(huán)專利商標代理有限公司 代理人 麥小嬋;郝傳鑫
地址 510000廣東省廣州市黃埔區(qū)伴河路90號
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種文本分類方法、裝置、電子設備及存儲介質(zhì),其中方法包括:獲取待分類文本中的結構化數(shù)據(jù)和非結構化數(shù)據(jù);對于非結構化數(shù)據(jù),根據(jù)LSTM神經(jīng)網(wǎng)絡模型,計算獲得非結構化數(shù)據(jù)的非結構化特征向量;對于結構化數(shù)據(jù),讀取結構化數(shù)據(jù)中所有的屬性值,并根據(jù)屬性表,確定每一屬性值對應的屬性標識;對于結構化數(shù)據(jù)中的每一個屬性值,根據(jù)屬性向量矩陣,查找獲得與屬性標識對應的屬性向量;并,根據(jù)每一屬性向量獲得結構化特征向量;根據(jù)非結構化特征向量和結構化特征向量,生成待分類特征向量;將所述待分類特征向量輸入預先建立的邏輯回歸分類器,計算獲得所述待分類文本的分類結果。本發(fā)明能夠對文本進行分類,提高編碼效率,且節(jié)省內(nèi)存。