一種基于知識(shí)圖譜提高文書(shū)檔案檢索效率的方法及系統(tǒng)
基本信息
申請(qǐng)?zhí)?/td> | CN202110397558.8 | 申請(qǐng)日 | - |
公開(kāi)(公告)號(hào) | CN113221562A | 公開(kāi)(公告)日 | 2021-08-06 |
申請(qǐng)公布號(hào) | CN113221562A | 申請(qǐng)公布日 | 2021-08-06 |
分類號(hào) | G06F40/295;G06F40/216;G06F16/36;G06F16/35;G06N3/04;G06N3/08 | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 劉澤;楊志勇 | 申請(qǐng)(專利權(quán))人 | 南京瑞拷得智慧信息科技有限公司 |
代理機(jī)構(gòu) | 南京千語(yǔ)知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) | 代理人 | 尚于杰;祁文彥 |
地址 | 210000 江蘇省南京市鼓樓區(qū)西康路1號(hào) | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開(kāi)了一種基于知識(shí)圖譜提高文書(shū)檔案檢索效率的方法及系統(tǒng),該方法包括一、從計(jì)算機(jī)中獲取文書(shū)檔案文本數(shù)據(jù);二、根據(jù)獲取的文本數(shù)據(jù)特點(diǎn)構(gòu)建文書(shū)檔案領(lǐng)域本體;三、從獲取的文本數(shù)據(jù)中抽取文書(shū)檔案領(lǐng)域本體的三元組實(shí)例數(shù)據(jù);步驟四、通過(guò)JanusGraph圖數(shù)據(jù)庫(kù)存儲(chǔ)文書(shū)檔案領(lǐng)域本體和抽取出的三元組實(shí)例數(shù)據(jù);步驟五、通過(guò)IKAnalyzer分詞工具對(duì)查詢語(yǔ)句進(jìn)行解析,用同義詞典進(jìn)行語(yǔ)義轉(zhuǎn)換,調(diào)用JanusGraph圖數(shù)據(jù)庫(kù)查詢API完成智能語(yǔ)義查詢。本發(fā)明以知識(shí)圖譜為基礎(chǔ),以文書(shū)檔案的事件概念為核心,挖掘文書(shū)檔案的文書(shū)信息和文書(shū)內(nèi)容的知識(shí),構(gòu)建文書(shū)檔案事件知識(shí)圖譜,通過(guò)構(gòu)建知識(shí)存儲(chǔ)模塊和知識(shí)查詢模塊提供文書(shū)檔案基于語(yǔ)義的檢索方式,提升了文書(shū)檔案檢索效率。 |
