一種基于cedar雙數(shù)組字典樹算法進(jìn)行術(shù)語(yǔ)匹配的方法
基本信息
申請(qǐng)?zhí)?/td> | CN201610897558.3 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN106528647A | 公開(公告)日 | 2017-03-22 |
申請(qǐng)公布號(hào) | CN106528647A | 申請(qǐng)公布日 | 2017-03-22 |
分類號(hào) | G06F17/30(2006.01)I;G06F17/28(2006.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 馮澤康 | 申請(qǐng)(專利權(quán))人 | 北京語(yǔ)聯(lián)爐火信息技術(shù)有限公司 |
代理機(jī)構(gòu) | 北京康盛知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | 北京語(yǔ)聯(lián)爐火信息技術(shù)有限公司;傳神語(yǔ)聯(lián)網(wǎng)網(wǎng)絡(luò)科技股份有限公司 |
地址 | 100086 北京市海淀區(qū)知春路51號(hào)1幢4層407室 | ||
法律狀態(tài) | - |
摘要
摘要 | 一種基于cedar雙數(shù)組字典樹算法進(jìn)行術(shù)語(yǔ)匹配的方法,其特征是包括建索引的步驟,及用索引進(jìn)行術(shù)語(yǔ)查詢匹配的步驟;其中,所述建索引的步驟是遍歷數(shù)據(jù)庫(kù),獲取術(shù)語(yǔ)集合,調(diào)用cedar雙數(shù)組字典樹插入術(shù)語(yǔ),用以形成術(shù)語(yǔ)集合的索引;所述cedar雙數(shù)組字典樹包括一個(gè)以基準(zhǔn)值和校驗(yàn)值為成員的結(jié)構(gòu)體數(shù)組,一個(gè)與結(jié)構(gòu)體數(shù)組體量相同的循環(huán)隊(duì)列;將cedar雙數(shù)組算法應(yīng)用于術(shù)語(yǔ)匹配引擎的建索引和根據(jù)索引來(lái)查詢術(shù)語(yǔ),極大地提升了術(shù)語(yǔ)匹配引擎的效率,同時(shí)該算法也避免了經(jīng)典的雙數(shù)組算法libdatrie對(duì)大量術(shù)語(yǔ)建索引時(shí)速度非常慢而不利于快速重建數(shù)據(jù)的缺點(diǎn);二叉樹作為一種輔助結(jié)構(gòu),可以用來(lái)快速地還原整個(gè)雙數(shù)組字典樹。 |
