一種文本信息分類方法、裝置、設備及可讀存儲介質(zhì)
基本信息
申請?zhí)?/td> | CN202010420260.X | 申請日 | - |
公開(公告)號 | CN111611379A | 公開(公告)日 | 2020-09-01 |
申請公布號 | CN111611379A | 申請公布日 | 2020-09-01 |
分類號 | G06F16/35(2019.01)I;G06F40/279(2020.01)I | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 朱菁;潘斌強;李霽;張俊;楊建明;毛瑞彬;錢鐵云;李旭暉;陳壯 | 申請(專利權)人 | 深圳證券信息有限公司 |
代理機構 | 北京集佳知識產(chǎn)權代理有限公司 | 代理人 | 深圳證券信息有限公司 |
地址 | 518000廣東省深圳市福田區(qū)紅荔西路203棟606室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種文本信息分類方法,包括:獲取待分類語料,并對待分類語料進行過濾處理,得到待分類信息;對待分類信息進行特征提取處理,得到待分類信息對應的主題特征和詞特征;利用主題特征和詞特征進行分類操作,得到待分類語料對應的分類結果;該方法在對待分類語料進行過濾處理得到待分類信息后,通過提取詞特征和主題特征,并利用其進行分類操作,可以充分考慮詞級特征和主題特征的互補關聯(lián)性,使得在分類時不僅可以考慮詞級特征的影響,同時還可以考慮主題特征的影響,提高了分類的準確程度;此外,本發(fā)明還提供了一種文本信息分類裝置、設備及計算機可讀存儲介質(zhì),同樣具有上述有益效果。?? |
