完美雙數(shù)組TRIE樹詞典管理與檢索方法
基本信息
申請?zhí)?/td> | CN200510130690.3 | 申請日 | - |
公開(公告)號 | CN100444167C | 公開(公告)日 | 2008-12-17 |
申請公布號 | CN100444167C | 申請公布日 | 2008-12-17 |
分類號 | G06F17/30(2006.01) | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 張華平;王思力 | 申請(專利權(quán))人 | 北京神州天脈網(wǎng)絡(luò)計算機有限公司 |
代理機構(gòu) | 中科專利商標代理有限責任公司 | 代理人 | 中國科學(xué)院計算技術(shù)研究所;靈玖中科軟件(北京)有限公司 |
地址 | 100080北京市海淀區(qū)中關(guān)村科學(xué)院南路6號 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明涉及自然語言處理領(lǐng)域和信息檢索領(lǐng)域,特別是一種完美雙數(shù)組TRIE樹詞典管理與檢索方法。將Trie樹結(jié)構(gòu)轉(zhuǎn)換成兩個線性數(shù)組表示,并在構(gòu)造過程中提出了一種優(yōu)化策略。同時提出一種自適應(yīng)編碼方案,以字節(jié)為編碼單位對字符進行自動編碼。包括步驟:(1)將詞典用Trie樹結(jié)構(gòu)表示;(2)將Trie樹轉(zhuǎn)換成兩個線性數(shù)組;(3)根據(jù)用戶的輸入,利用生成的兩個數(shù)組實現(xiàn)對詞典的檢索。其具體步驟包括:步驟1,對詞典以字節(jié)為單位進行自動編碼生成序列碼文件;步驟2,將詞典用Trie樹表示,利用序列碼文件將Trie樹轉(zhuǎn)換成兩個數(shù)組來表示;步驟3,在生成的兩個線性數(shù)組中檢索用戶提交的詞。 |
