一種多級文本分類方法及系統(tǒng)

基本信息

申請?zhí)?/td> CN201910152479.3 申請日 -
公開(公告)號 CN109902178A 公開(公告)日 2019-06-18
申請公布號 CN109902178A 申請公布日 2019-06-18
分類號 G06F16/35 分類 計算;推算;計數(shù);
發(fā)明人 曾俊瑀;張文斌;賈顯伏;喬詠田 申請(專利權)人 云孚科技(北京)有限公司
代理機構 北京世譽鑫誠專利代理事務所(普通合伙) 代理人 孫國棟
地址 100085 北京市海淀區(qū)上地五街7號一層101A室
法律狀態(tài) -

摘要

摘要 本發(fā)明公開的多級文本分類方法及系統(tǒng),涉及數(shù)據(jù)處理技術領域,通過將當前待分類的文本分別輸入訓練過的多個文本分類模型,計算各個層文本的概率,根據(jù)公式Pn=p_A×p_A1×p_A11×…×p_A11…1,分別計算第n層文本中各個葉子節(jié)點的概率,選取概率大于設定閾值的第n層文本并對第n層文本對應的概率進行歸一化處理,得到文本的分類結果,能夠簡單快速地實現(xiàn)對多級文本的分類,簡化了多級文本分類的難度,提高了多級文本分類的效率及準確率,解決了現(xiàn)有技術存在的對多級文本分類困難、效率低及準確率低的缺陷。