一種基于cedar雙數組字典樹算法進行術語匹配的方法

基本信息

申請?zhí)?/td> CN201610897558.3 申請日 -
公開(公告)號 CN106528647B 公開(公告)日 2019-07-23
申請公布號 CN106528647B 申請公布日 2019-07-23
分類號 G06F16/31;G06F17/28 分類 計算;推算;計數;
發(fā)明人 馮澤康 申請(專利權)人 北京語聯(lián)爐火信息技術有限公司
代理機構 北京康盛知識產權代理有限公司 代理人 傳神語聯(lián)網網絡科技股份有限公司
地址 430073 湖北省武漢市東湖新技術開發(fā)區(qū)高新大道999號未來城龍山創(chuàng)新園一期B2棟(除101室以外)(自貿區(qū)武漢片區(qū))
法律狀態(tài) -

摘要

摘要 一種基于cedar雙數組字典樹算法進行術語匹配的方法,其特征是包括包括建索引的步驟,及用索引進行術語查詢匹配的步驟;其中,所述建索引的步驟是遍歷數據庫,獲取術語集合,調用cedar雙數組字典樹插入術語,用以形成術語集合的索引;所述cedar雙數組字典樹包括一個以基準值和校驗值為成員的結構體數組,一個與結構體數組體量相同的循環(huán)隊列;將cedar雙數組算法應用于術語匹配引擎的建索引和根據索引來查詢術語,極大地提升了術語匹配引擎的效率,同時該算法也避免了經典的雙數組算法libdatrie對大量術語建索引時速度非常慢而不利于快速重建數據的缺點;二叉樹作為一種輔助結構,可以用來快速地還原整個雙數組字典樹。