短信過濾、分類方法及系統(tǒng)

基本信息

申請?zhí)?/td> CN200910077123.4 申請日 -
公開(公告)號 CN101784022A 公開(公告)日 2010-07-21
申請公布號 CN101784022A 申請公布日 2010-07-21
分類號 H04W4/14(2006.01)I;G06F17/30(2006.01)I 分類 電通信技術(shù);
發(fā)明人 柳呈文 申請(專利權(quán))人 北京炎黃新星網(wǎng)絡科技有限公司
代理機構(gòu) - 代理人 -
地址 100085 北京市海淀區(qū)上地三街9號嘉華大廈F座805室
法律狀態(tài) -

摘要

摘要 本發(fā)明在傳統(tǒng)短信過濾的基礎(chǔ)上,創(chuàng)新性提出基于發(fā)送量特征及短信內(nèi)容特征方式,結(jié)合“漢字正則表達式”、及“改進型貝葉斯算法”過濾垃圾短信的方法,在提高垃圾短信識別準確率的同時,降低了垃圾短信的誤報率和漏報率。同時將垃圾短信進行二次分類,方便用戶個性化設置。包括以下步驟:步驟1對短信文本進行預處理;步驟2發(fā)送量匹配,匹配發(fā)送的內(nèi)容與發(fā)送數(shù)量;步驟3運用“漢字正則表達式”及“詞典加詞性”方法進行詞法分詞;步驟4使用垃圾短信分類器的分類,運用“漢字正則表達式”定義的短信特征規(guī)則,通過改進型貝葉斯算法進行計算概率,識別垃圾/非垃圾短信;步驟5使用短信類型歸屬分類器的分類,對已識別的垃圾短信進行分類處理。