一種基于知識庫應(yīng)用的語義搜索方法

基本信息

申請?zhí)?/td> CN202210207064.3 申請日 -
公開(公告)號 CN114547253A 公開(公告)日 2022-05-27
申請公布號 CN114547253A 申請公布日 2022-05-27
分類號 G06F16/33(2019.01)I;G06F16/332(2019.01)I;G06F16/36(2019.01)I;G06F16/31(2019.01)I 分類 計算;推算;計數(shù);
發(fā)明人 姜曉丹;張晶;王雙;張成凱;傅天隆;呂子祺;韓興源 申請(專利權(quán))人 北京伽睿智能科技集團有限公司
代理機構(gòu) 北京知呱呱知識產(chǎn)權(quán)代理有限公司 代理人 -
地址 100192北京市海淀區(qū)西小口路66號中關(guān)村東升科技園北領(lǐng)地C-1樓1層106(東升地區(qū))
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種基于知識庫應(yīng)用的語義搜索方法,所述方法為:S1、錄入文檔,通過分詞器將文檔拆分為詞語,統(tǒng)計詞語出現(xiàn)的次數(shù),記錄詞語和文檔映射關(guān)系,將所有詞語和映射關(guān)系放入內(nèi)存當(dāng)做索引;S2、將索引分成多個分片,并對每個分片進行備份,每個分片和備份分布在多臺服務(wù)器上,以分布式的方式提供查詢服務(wù);S3、輸入關(guān)鍵詞進行智能搜索,基于關(guān)鍵詞進行索引匹配和語義相似性擴展搜索,基于關(guān)鍵詞圖譜的語義擴展搜索具體實現(xiàn)邏輯;S4、根據(jù)確定的基于用戶行為的語義相似度及語義擴展結(jié)果,預(yù)測用戶對知識庫資源的評分,將評分高資源信息作為推薦列表返回給用戶。本發(fā)明解決了現(xiàn)有資源搜索速度慢、準(zhǔn)確率低的問題。