短信匹配及去重方法
基本信息
申請?zhí)?/td> | CN201210015435.4 | 申請日 | - |
公開(公告)號(hào) | CN102662943A | 公開(公告)日 | 2012-09-12 |
申請公布號(hào) | CN102662943A | 申請公布日 | 2012-09-12 |
分類號(hào) | G06F17/30(2006.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 曹一清 | 申請(專利權(quán))人 | 蘇州酷動(dòng)多媒體科技有限公司 |
代理機(jī)構(gòu) | 北京市合德專利事務(wù)所 | 代理人 | 王文會(huì) |
地址 | 215400 江蘇省蘇州市太倉經(jīng)濟(jì)開發(fā)區(qū)北京西路6號(hào) | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種短信匹配及去重方法,包括以下步驟:服務(wù)器中初始種子短信庫為空,短信庫對應(yīng)于一平衡二叉樹,且平衡二叉樹初始化為空;設(shè)置匹配的相似度閾值;對新增的一條待測短信,首先計(jì)算該短信匹配成功所需的最少匹配字符數(shù);建立一個(gè)匹配數(shù)組,長為短信庫中已有短信條數(shù),記錄待測短信與已有短信的匹配字符數(shù),初始為0;對待測短信進(jìn)行排序,排序結(jié)果為非重復(fù)的順序字符以及對應(yīng)字符出現(xiàn)的次數(shù),不包含標(biāo)點(diǎn)符號(hào);在平衡二叉樹中查找相應(yīng)的字符,對排序后的待測短信的每個(gè)字符進(jìn)行匹配,同時(shí)更新匹配數(shù)組和平衡二叉樹;待測短信匹配過程結(jié)束后,找出匹配數(shù)組中數(shù)值大于最少匹配字符數(shù)的對應(yīng)短信序列,進(jìn)行去重操作。 |
