一種海量音頻數(shù)據(jù)中的字符串快速模糊匹配算法
基本信息
申請?zhí)?/td> | CN201610848974.4 | 申請日 | - |
公開(公告)號 | CN106528599A | 公開(公告)日 | 2017-03-22 |
申請公布號 | CN106528599A | 申請公布日 | 2017-03-22 |
分類號 | G06F17/30(2006.01)I | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 田學紅;朱曉明;于拾全 | 申請(專利權(quán))人 | 深圳凡豆信息科技有限公司 |
代理機構(gòu) | 廣州天河恒華智信專利代理事務(wù)所(普通合伙) | 代理人 | 深圳凡豆信息科技有限公司 |
地址 | 518000 廣東省深圳市南山區(qū)前海深港青年夢工場7棟110室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種字符串的快速模糊匹配算法。本發(fā)明首先對數(shù)據(jù)庫中的文本進行數(shù)據(jù)的預(yù)處理,從而獲得統(tǒng)計模型,并通過Hash建立索引。輸入文本是一個較短的字符串,本發(fā)明遍歷其中所有漢字,激活有限字符全集中對應(yīng)漢字的位置。將有限字符全集的激活狀態(tài)映射到每一個標簽上,從而達到過濾標簽的目的。對過濾出來的少量標簽進行與文本的匹配,用DTW算法進行近似字符串匹配。根據(jù)匹配近似度結(jié)果進行打分,并排序,返回搜索到的結(jié)果。本發(fā)明通過高效的標簽過濾方法,大幅度地提升了字符串匹配算法的計算效率;同時在對輸入文本進行匹配的過程中,達到模糊匹配的效果,對于模糊語言也具有很好的匹配性能。 |
