一種海量音頻數(shù)據(jù)中的字符串快速模糊匹配算法
基本信息
申請(qǐng)?zhí)?/td> | CN201610848974.4 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN106528599A | 公開(公告)日 | 2017-03-22 |
申請(qǐng)公布號(hào) | CN106528599A | 申請(qǐng)公布日 | 2017-03-22 |
分類號(hào) | G06F17/30(2006.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 田學(xué)紅;朱曉明;于拾全 | 申請(qǐng)(專利權(quán))人 | 深圳凡豆信息科技有限公司 |
代理機(jī)構(gòu) | 廣州天河恒華智信專利代理事務(wù)所(普通合伙) | 代理人 | 深圳凡豆信息科技有限公司 |
地址 | 518000 廣東省深圳市南山區(qū)前海深港青年夢(mèng)工場(chǎng)7棟110室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種字符串的快速模糊匹配算法。本發(fā)明首先對(duì)數(shù)據(jù)庫(kù)中的文本進(jìn)行數(shù)據(jù)的預(yù)處理,從而獲得統(tǒng)計(jì)模型,并通過Hash建立索引。輸入文本是一個(gè)較短的字符串,本發(fā)明遍歷其中所有漢字,激活有限字符全集中對(duì)應(yīng)漢字的位置。將有限字符全集的激活狀態(tài)映射到每一個(gè)標(biāo)簽上,從而達(dá)到過濾標(biāo)簽的目的。對(duì)過濾出來的少量標(biāo)簽進(jìn)行與文本的匹配,用DTW算法進(jìn)行近似字符串匹配。根據(jù)匹配近似度結(jié)果進(jìn)行打分,并排序,返回搜索到的結(jié)果。本發(fā)明通過高效的標(biāo)簽過濾方法,大幅度地提升了字符串匹配算法的計(jì)算效率;同時(shí)在對(duì)輸入文本進(jìn)行匹配的過程中,達(dá)到模糊匹配的效果,對(duì)于模糊語言也具有很好的匹配性能。 |
