一種搜索引擎的建立方法及系統(tǒng)
基本信息
申請?zhí)?/td> | CN201710832395.5 | 申請日 | - |
公開(公告)號 | CN107818130A | 公開(公告)日 | 2018-03-20 |
申請公布號 | CN107818130A | 申請公布日 | 2018-03-20 |
分類號 | G06F17/30 | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 楊家 | 申請(專利權(quán))人 | 深圳市電陶思創(chuàng)科技有限公司 |
代理機(jī)構(gòu) | 深圳市恒申知識產(chǎn)權(quán)事務(wù)所(普通合伙) | 代理人 | 王利彬 |
地址 | 518100 廣東省深圳市寶安區(qū)西鄉(xiāng)街道固戍開發(fā)區(qū)泰華梧桐工業(yè)園14A號建筑7、8層 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明適用于互聯(lián)網(wǎng)技術(shù)領(lǐng)域,提供了一種數(shù)據(jù)檢索方法,包括:收集部署于不同的網(wǎng)絡(luò)節(jié)點的信息源實時采集的數(shù)據(jù);將收集到物聯(lián)網(wǎng)數(shù)據(jù)按照預(yù)置的標(biāo)簽類別予以標(biāo)注得到標(biāo)注數(shù)據(jù);根據(jù)標(biāo)注數(shù)據(jù)構(gòu)建基于行業(yè)分詞庫的倒排索引;倒排索引包含行業(yè)分詞庫中各分詞與標(biāo)注數(shù)據(jù)的對應(yīng)關(guān)系且意義相近的分詞被索引到相同的文檔數(shù)據(jù)上;根據(jù)倒排索引輸出用于進(jìn)行目錄檢索和全文語義檢索的檢索接口。通過本發(fā)明實施例提供的檢索接口,在用戶輸入任意中文分詞時,根據(jù)該中文分詞展示相匹配的檢索結(jié)果,該檢索結(jié)果為物聯(lián)網(wǎng)相關(guān)的實時數(shù)據(jù),同時,當(dāng)用戶通過檢索接口輸入中文分詞時,搜索引擎能夠給用戶提供檢索建議,使得用戶進(jìn)行搜索時省時省力。 |
