一種基于內容的恐怖文本識別方法
基本信息
申請?zhí)?/td> | CN201410171360.8 | 申請日 | - |
公開(公告)號 | CN103942191A | 公開(公告)日 | 2014-07-23 |
申請公布號 | CN103942191A | 申請公布日 | 2014-07-23 |
分類號 | G06F17/27(2006.01)I | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 胡衛(wèi)明;劉國旗;李兵 | 申請(專利權)人 | 人民中科(山東)智能技術有限公司 |
代理機構 | 中科專利商標代理有限責任公司 | 代理人 | 宋焰琴 |
地址 | 100190 北京市海淀區(qū)中關村東路95號 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種基于內容的恐怖文本識別方法,該方法包括:首先,對需要識別的文本進行預處理,以消除錯誤數(shù)據和冗余數(shù)據對識別結果的消極影響;其次,構建基于內容的文本分類器模型,該模型能夠分別利用文本標題分類器和文本內容分類器對文本標題和文本內容進行獨立識別,然后將兩種識別結果進行決策融合,最終得出識別結果;最后,將格式化后的待識別文本數(shù)據作為基于文本分類器模型的輸入,該模型的輸出即為文本的識別結果。該方法在實驗數(shù)據庫上能夠取得良好的實驗效果,其識別結果具有較高的可靠性和穩(wěn)定性。 |
