一種搜索引擎的建立方法及系統(tǒng)

基本信息

申請(qǐng)?zhí)?/td> CN201710832395.5 申請(qǐng)日 -
公開(公告)號(hào) CN107818130A 公開(公告)日 2018-03-20
申請(qǐng)公布號(hào) CN107818130A 申請(qǐng)公布日 2018-03-20
分類號(hào) G06F17/30 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 楊家 申請(qǐng)(專利權(quán))人 深圳市電陶思創(chuàng)科技有限公司
代理機(jī)構(gòu) 深圳市恒申知識(shí)產(chǎn)權(quán)事務(wù)所(普通合伙) 代理人 王利彬
地址 518100 廣東省深圳市寶安區(qū)西鄉(xiāng)街道固戍開發(fā)區(qū)泰華梧桐工業(yè)園14A號(hào)建筑7、8層
法律狀態(tài) -

摘要

摘要 本發(fā)明適用于互聯(lián)網(wǎng)技術(shù)領(lǐng)域,提供了一種數(shù)據(jù)檢索方法,包括:收集部署于不同的網(wǎng)絡(luò)節(jié)點(diǎn)的信息源實(shí)時(shí)采集的數(shù)據(jù);將收集到物聯(lián)網(wǎng)數(shù)據(jù)按照預(yù)置的標(biāo)簽類別予以標(biāo)注得到標(biāo)注數(shù)據(jù);根據(jù)標(biāo)注數(shù)據(jù)構(gòu)建基于行業(yè)分詞庫(kù)的倒排索引;倒排索引包含行業(yè)分詞庫(kù)中各分詞與標(biāo)注數(shù)據(jù)的對(duì)應(yīng)關(guān)系且意義相近的分詞被索引到相同的文檔數(shù)據(jù)上;根據(jù)倒排索引輸出用于進(jìn)行目錄檢索和全文語義檢索的檢索接口。通過本發(fā)明實(shí)施例提供的檢索接口,在用戶輸入任意中文分詞時(shí),根據(jù)該中文分詞展示相匹配的檢索結(jié)果,該檢索結(jié)果為物聯(lián)網(wǎng)相關(guān)的實(shí)時(shí)數(shù)據(jù),同時(shí),當(dāng)用戶通過檢索接口輸入中文分詞時(shí),搜索引擎能夠給用戶提供檢索建議,使得用戶進(jìn)行搜索時(shí)省時(shí)省力。