完美雙數(shù)組TRIE樹詞典管理與檢索方法

基本信息

申請?zhí)?/td> CN200510130690.3 申請日 -
公開(公告)號 CN100444167C 公開(公告)日 2008-12-17
申請公布號 CN100444167C 申請公布日 2008-12-17
分類號 G06F17/30(2006.01) 分類 計算;推算;計數(shù);
發(fā)明人 張華平;王思力 申請(專利權(quán))人 北京神州天脈網(wǎng)絡(luò)計算機有限公司
代理機構(gòu) 中科專利商標代理有限責任公司 代理人 中國科學(xué)院計算技術(shù)研究所;靈玖中科軟件(北京)有限公司
地址 100080北京市海淀區(qū)中關(guān)村科學(xué)院南路6號
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及自然語言處理領(lǐng)域和信息檢索領(lǐng)域,特別是一種完美雙數(shù)組TRIE樹詞典管理與檢索方法。將Trie樹結(jié)構(gòu)轉(zhuǎn)換成兩個線性數(shù)組表示,并在構(gòu)造過程中提出了一種優(yōu)化策略。同時提出一種自適應(yīng)編碼方案,以字節(jié)為編碼單位對字符進行自動編碼。包括步驟:(1)將詞典用Trie樹結(jié)構(gòu)表示;(2)將Trie樹轉(zhuǎn)換成兩個線性數(shù)組;(3)根據(jù)用戶的輸入,利用生成的兩個數(shù)組實現(xiàn)對詞典的檢索。其具體步驟包括:步驟1,對詞典以字節(jié)為單位進行自動編碼生成序列碼文件;步驟2,將詞典用Trie樹表示,利用序列碼文件將Trie樹轉(zhuǎn)換成兩個數(shù)組來表示;步驟3,在生成的兩個線性數(shù)組中檢索用戶提交的詞。