基于垂直搜索引擎的數(shù)字內(nèi)容查詢系統(tǒng)

基本信息

申請(qǐng)?zhí)?/td> CN201710690520.3 申請(qǐng)日 -
公開(公告)號(hào) CN107451289A 公開(公告)日 2017-12-08
申請(qǐng)公布號(hào) CN107451289A 申請(qǐng)公布日 2017-12-08
分類號(hào) G06F17/30(2006.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 賀麟;楊霖;李麗琴;肖智寬 申請(qǐng)(專利權(quán))人 四川匯源吉迅數(shù)碼科技有限公司
代理機(jī)構(gòu) 成都九鼎天元知識(shí)產(chǎn)權(quán)代理有限公司 代理人 四川匯源吉迅數(shù)碼科技有限公司
地址 610031 四川省成都市青羊區(qū)外南人民路131號(hào)
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種基于垂直搜索引擎的數(shù)字內(nèi)容查詢系統(tǒng),該系統(tǒng)包括主節(jié)點(diǎn)服務(wù)器和多個(gè)從節(jié)點(diǎn)服務(wù)器,主節(jié)點(diǎn)服務(wù)器包括管理器和查詢器,從節(jié)點(diǎn)服務(wù)器包括爬行器和索引器;管理器用于分割待爬行的網(wǎng)頁的網(wǎng)頁鏈接得到多個(gè)網(wǎng)頁子鏈接,并將網(wǎng)頁子鏈接分配給多個(gè)從節(jié)點(diǎn)服務(wù)器;爬行器用于按照分割的網(wǎng)頁子鏈接抓取網(wǎng)頁文本數(shù)據(jù),并將網(wǎng)頁子鏈接和網(wǎng)頁文本數(shù)據(jù)綁定后保存到網(wǎng)頁數(shù)據(jù)庫中:索引器用于對(duì)網(wǎng)頁數(shù)據(jù)庫中的網(wǎng)頁數(shù)據(jù)進(jìn)行分詞,并按照分詞執(zhí)行全文索引得到索引結(jié)果;查詢器用于解析用戶的查詢請(qǐng)求得到查詢關(guān)鍵詞和查詢條件,根據(jù)查詢關(guān)鍵詞和查詢條件生成查詢?nèi)蝿?wù),并執(zhí)行查詢?nèi)蝿?wù)獲得查詢結(jié)果。本發(fā)明能夠大幅提高用戶的查詢性能。