一種基于圖知識庫的分布式信息檢索集合選擇方法

基本信息

申請?zhí)?/td> CN201710228718.X 申請日 -
公開(公告)號 CN107133274B 公開(公告)日 2020-12-15
申請公布號 CN107133274B 申請公布日 2020-12-15
分類號 G06F16/33;G06F16/36;G06F40/295;G06F40/30 分類 計算;推算;計數(shù);
發(fā)明人 吳勇;陳嶺;韓保禮;季海琦;鄭羽 申請(專利權)人 浙江鴻程計算機系統(tǒng)有限公司
代理機構 杭州之江專利事務所(普通合伙) 代理人 張慧英
地址 310053 浙江省杭州市濱江區(qū)浦沿街道偉業(yè)路1號2幢
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及一種基于圖知識庫的分布式信息檢索集合選擇方法,主要包括如下步驟:1)采用實體鏈接方法,從各個集合的樣本文檔中獲取集合的實體詞集;2)基于上下文相關度和結構相關度,計算實體詞的權重,使用加權的實體詞集表示集合的語義信息;3)采用查詢擴展方法擴展查詢中包含的實體詞,并為查詢實體詞賦予不同的權重;4)采用查詢與集合相關度度量方法計算集合評分,選擇評分較高的前若干個集合。本發(fā)明利用圖知識庫中蘊含的實體關系和網(wǎng)絡結構,使用基于圖知識庫的集合語義建模方法、查詢擴展方法和查詢與集合相關度度量方法,提高了集合選擇方法的準確度。