詞表生成方法、文本分類方法、裝置、設備及存儲介質

基本信息

申請?zhí)?/td> CN201811080887.4 申請日 -
公開(公告)號 CN109325122A 公開(公告)日 2019-02-12
申請公布號 CN109325122A 申請公布日 2019-02-12
分類號 G06F16/35;G06F16/332;G06F16/36 分類 計算;推算;計數;
發(fā)明人 雷昕 申請(專利權)人 深圳市牛鼎豐科技有限公司
代理機構 深圳市精英專利事務所 代理人 深圳市牛鼎豐科技有限公司
地址 518000 廣東省深圳市前海深港合作區(qū)前灣一路1號A棟201室(入駐深圳市前海商務秘書有限公司)
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種詞表生成方法、文本分類方法、裝置、設備及存儲介質。該生成方法包括:獲取多個訓練用樣本,每個訓練用樣本包括文本內容和文本標簽;對所述多個訓練用樣本進行數據處理;獲取Lable?LDA算法的預設迭代次數;根據預設迭代次數,利用Lable?LDA算法對經數據處理后的多個訓練用樣本進行迭代訓練以生成文本標簽的詞表;以及計算所述文本標簽的詞表中所有詞語的權重,將權重占比大于第一預設值的所有詞語匯總作為該文本標簽的第一詞表,將權重占比小于第二預設值的所有詞語匯總作為該文本標簽的第二詞表。通過實施本方案可以解決現(xiàn)有的文本分類方法中分類準確性不高以及分類效率較低的問題。