一種基于cedar雙數組字典樹算法進行術語匹配的方法
基本信息
申請?zhí)?/td> | CN201610897558.3 | 申請日 | - |
公開(公告)號 | CN106528647B | 公開(公告)日 | 2019-07-23 |
申請公布號 | CN106528647B | 申請公布日 | 2019-07-23 |
分類號 | G06F16/31;G06F17/28 | 分類 | 計算;推算;計數; |
發(fā)明人 | 馮澤康 | 申請(專利權)人 | 北京語聯(lián)爐火信息技術有限公司 |
代理機構 | 北京康盛知識產權代理有限公司 | 代理人 | 傳神語聯(lián)網網絡科技股份有限公司 |
地址 | 430073 湖北省武漢市東湖新技術開發(fā)區(qū)高新大道999號未來城龍山創(chuàng)新園一期B2棟(除101室以外)(自貿區(qū)武漢片區(qū)) | ||
法律狀態(tài) | - |
摘要
摘要 | 一種基于cedar雙數組字典樹算法進行術語匹配的方法,其特征是包括包括建索引的步驟,及用索引進行術語查詢匹配的步驟;其中,所述建索引的步驟是遍歷數據庫,獲取術語集合,調用cedar雙數組字典樹插入術語,用以形成術語集合的索引;所述cedar雙數組字典樹包括一個以基準值和校驗值為成員的結構體數組,一個與結構體數組體量相同的循環(huán)隊列;將cedar雙數組算法應用于術語匹配引擎的建索引和根據索引來查詢術語,極大地提升了術語匹配引擎的效率,同時該算法也避免了經典的雙數組算法libdatrie對大量術語建索引時速度非常慢而不利于快速重建數據的缺點;二叉樹作為一種輔助結構,可以用來快速地還原整個雙數組字典樹。 |
