一種多級文本分類方法及系統(tǒng)
基本信息
申請?zhí)?/td> | CN201910152479.3 | 申請日 | - |
公開(公告)號 | CN109902178A | 公開(公告)日 | 2019-06-18 |
申請公布號 | CN109902178A | 申請公布日 | 2019-06-18 |
分類號 | G06F16/35 | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 曾俊瑀;張文斌;賈顯伏;喬詠田 | 申請(專利權)人 | 云孚科技(北京)有限公司 |
代理機構 | 北京世譽鑫誠專利代理事務所(普通合伙) | 代理人 | 孫國棟 |
地址 | 100085 北京市海淀區(qū)上地五街7號一層101A室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開的多級文本分類方法及系統(tǒng),涉及數(shù)據(jù)處理技術領域,通過將當前待分類的文本分別輸入訓練過的多個文本分類模型,計算各個層文本的概率,根據(jù)公式Pn=p_A×p_A1×p_A11×…×p_A11…1,分別計算第n層文本中各個葉子節(jié)點的概率,選取概率大于設定閾值的第n層文本并對第n層文本對應的概率進行歸一化處理,得到文本的分類結果,能夠簡單快速地實現(xiàn)對多級文本的分類,簡化了多級文本分類的難度,提高了多級文本分類的效率及準確率,解決了現(xiàn)有技術存在的對多級文本分類困難、效率低及準確率低的缺陷。 |
