短信過濾、分類方法及系統(tǒng)
基本信息
申請?zhí)?/td> | CN200910077123.4 | 申請日 | - |
公開(公告)號 | CN101784022A | 公開(公告)日 | 2010-07-21 |
申請公布號 | CN101784022A | 申請公布日 | 2010-07-21 |
分類號 | H04W4/14(2006.01)I;G06F17/30(2006.01)I | 分類 | 電通信技術(shù); |
發(fā)明人 | 柳呈文 | 申請(專利權(quán))人 | 北京炎黃新星網(wǎng)絡科技有限公司 |
代理機構(gòu) | - | 代理人 | - |
地址 | 100085 北京市海淀區(qū)上地三街9號嘉華大廈F座805室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明在傳統(tǒng)短信過濾的基礎(chǔ)上,創(chuàng)新性提出基于發(fā)送量特征及短信內(nèi)容特征方式,結(jié)合“漢字正則表達式”、及“改進型貝葉斯算法”過濾垃圾短信的方法,在提高垃圾短信識別準確率的同時,降低了垃圾短信的誤報率和漏報率。同時將垃圾短信進行二次分類,方便用戶個性化設置。包括以下步驟:步驟1對短信文本進行預處理;步驟2發(fā)送量匹配,匹配發(fā)送的內(nèi)容與發(fā)送數(shù)量;步驟3運用“漢字正則表達式”及“詞典加詞性”方法進行詞法分詞;步驟4使用垃圾短信分類器的分類,運用“漢字正則表達式”定義的短信特征規(guī)則,通過改進型貝葉斯算法進行計算概率,識別垃圾/非垃圾短信;步驟5使用短信類型歸屬分類器的分類,對已識別的垃圾短信進行分類處理。 |
