一種基于分布式數(shù)據(jù)庫的全文搜索引擎

基本信息

申請?zhí)?/td> CN201710395591.0 申請日 -
公開(公告)號 CN107229714A 公開(公告)日 2017-10-03
申請公布號 CN107229714A 申請公布日 2017-10-03
分類號 G06F17/30(2006.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 江和慧;黃顯洛 申請(專利權(quán))人 杭州宇為科技有限公司
代理機(jī)構(gòu) 浙江翔隆專利事務(wù)所(普通合伙) 代理人 郭關(guān)夫
地址 310026 浙江省杭州市濱江區(qū)長河街道長河路475號1幢13層1325室
法律狀態(tài) -

摘要

摘要 本發(fā)明提出一種基于分布式數(shù)據(jù)庫的全文搜索引擎,包括索引和搜索,其中:索引是將文檔和文檔經(jīng)過分詞后的單詞存入分布式數(shù)據(jù)庫;搜索是根據(jù)用戶的輸入,返回包含用戶輸入以及經(jīng)過排序的結(jié)果。本發(fā)明使用三張表(即單詞表、文檔表和語料庫表),采用不同的均衡字段,單詞表用單詞id分表,文檔表用文檔id分表,語料庫表用單詞id分表,從而在查詢的時(shí)候,按照單詞進(jìn)行查詢,單詞表按照單詞id作為均衡字段,只需要到指定的某些節(jié)點(diǎn)上執(zhí)行即可,其搜索效率大大地提高。使用了分布式數(shù)據(jù)庫作為存儲介質(zhì),可以利用其強(qiáng)大的緩存和sql計(jì)算功能,另外分布式數(shù)據(jù)庫自身帶有分布式功能,使其具有很強(qiáng)的擴(kuò)展能力。