一種基于cedar雙數(shù)組字典樹算法進(jìn)行術(shù)語(yǔ)匹配的方法

基本信息

申請(qǐng)?zhí)?/td> CN201610897558.3 申請(qǐng)日 -
公開(公告)號(hào) CN106528647A 公開(公告)日 2017-03-22
申請(qǐng)公布號(hào) CN106528647A 申請(qǐng)公布日 2017-03-22
分類號(hào) G06F17/30(2006.01)I;G06F17/28(2006.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 馮澤康 申請(qǐng)(專利權(quán))人 北京語(yǔ)聯(lián)爐火信息技術(shù)有限公司
代理機(jī)構(gòu) 北京康盛知識(shí)產(chǎn)權(quán)代理有限公司 代理人 北京語(yǔ)聯(lián)爐火信息技術(shù)有限公司;傳神語(yǔ)聯(lián)網(wǎng)網(wǎng)絡(luò)科技股份有限公司
地址 100086 北京市海淀區(qū)知春路51號(hào)1幢4層407室
法律狀態(tài) -

摘要

摘要 一種基于cedar雙數(shù)組字典樹算法進(jìn)行術(shù)語(yǔ)匹配的方法,其特征是包括建索引的步驟,及用索引進(jìn)行術(shù)語(yǔ)查詢匹配的步驟;其中,所述建索引的步驟是遍歷數(shù)據(jù)庫(kù),獲取術(shù)語(yǔ)集合,調(diào)用cedar雙數(shù)組字典樹插入術(shù)語(yǔ),用以形成術(shù)語(yǔ)集合的索引;所述cedar雙數(shù)組字典樹包括一個(gè)以基準(zhǔn)值和校驗(yàn)值為成員的結(jié)構(gòu)體數(shù)組,一個(gè)與結(jié)構(gòu)體數(shù)組體量相同的循環(huán)隊(duì)列;將cedar雙數(shù)組算法應(yīng)用于術(shù)語(yǔ)匹配引擎的建索引和根據(jù)索引來(lái)查詢術(shù)語(yǔ),極大地提升了術(shù)語(yǔ)匹配引擎的效率,同時(shí)該算法也避免了經(jīng)典的雙數(shù)組算法libdatrie對(duì)大量術(shù)語(yǔ)建索引時(shí)速度非常慢而不利于快速重建數(shù)據(jù)的缺點(diǎn);二叉樹作為一種輔助結(jié)構(gòu),可以用來(lái)快速地還原整個(gè)雙數(shù)組字典樹。