一種基于分布式數(shù)據(jù)庫的全文搜索引擎

基本信息

申請?zhí)?/td> CN201710395591.0 申請日 -
公開(公告)號 CN107229714B 公開(公告)日 2020-02-14
申請公布號 CN107229714B 申請公布日 2020-02-14
分類號 G06F16/93;G06F16/27 分類 計算;推算;計數(shù);
發(fā)明人 江和慧;黃顯洛 申請(專利權(quán))人 杭州宇為科技有限公司
代理機構(gòu) 浙江翔隆專利事務(wù)所(普通合伙) 代理人 郭關(guān)夫
地址 310026 浙江省杭州市濱江區(qū)長河街道長河路475號1幢13層1325室
法律狀態(tài) -

摘要

摘要 本發(fā)明提出一種基于分布式數(shù)據(jù)庫的全文搜索引擎,包括索引和搜索,其中:索引是將文檔和文檔經(jīng)過分詞后的單詞存入分布式數(shù)據(jù)庫;搜索是根據(jù)用戶的輸入,返回包含用戶輸入以及經(jīng)過排序的結(jié)果。本發(fā)明使用三張表(即單詞表、文檔表和語料庫表),采用不同的均衡字段,單詞表用單詞id分表,文檔表用文檔id分表,語料庫表用單詞id分表,從而在查詢的時候,按照單詞進行查詢,單詞表按照單詞id作為均衡字段,只需要到指定的某些節(jié)點上執(zhí)行即可,其搜索效率大大地提高。使用了分布式數(shù)據(jù)庫作為存儲介質(zhì),可以利用其強大的緩存和sql計算功能,另外分布式數(shù)據(jù)庫自身帶有分布式功能,使其具有很強的擴展能力。