一種基于知識(shí)圖譜提高文書(shū)檔案檢索效率的方法及系統(tǒng)

基本信息

申請(qǐng)?zhí)?/td> CN202110397558.8 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN113221562A 公開(kāi)(公告)日 2021-08-06
申請(qǐng)公布號(hào) CN113221562A 申請(qǐng)公布日 2021-08-06
分類號(hào) G06F40/295;G06F40/216;G06F16/36;G06F16/35;G06N3/04;G06N3/08 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 劉澤;楊志勇 申請(qǐng)(專利權(quán))人 南京瑞拷得智慧信息科技有限公司
代理機(jī)構(gòu) 南京千語(yǔ)知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 尚于杰;祁文彥
地址 210000 江蘇省南京市鼓樓區(qū)西康路1號(hào)
法律狀態(tài) -

摘要

摘要 本發(fā)明公開(kāi)了一種基于知識(shí)圖譜提高文書(shū)檔案檢索效率的方法及系統(tǒng),該方法包括一、從計(jì)算機(jī)中獲取文書(shū)檔案文本數(shù)據(jù);二、根據(jù)獲取的文本數(shù)據(jù)特點(diǎn)構(gòu)建文書(shū)檔案領(lǐng)域本體;三、從獲取的文本數(shù)據(jù)中抽取文書(shū)檔案領(lǐng)域本體的三元組實(shí)例數(shù)據(jù);步驟四、通過(guò)JanusGraph圖數(shù)據(jù)庫(kù)存儲(chǔ)文書(shū)檔案領(lǐng)域本體和抽取出的三元組實(shí)例數(shù)據(jù);步驟五、通過(guò)IKAnalyzer分詞工具對(duì)查詢語(yǔ)句進(jìn)行解析,用同義詞典進(jìn)行語(yǔ)義轉(zhuǎn)換,調(diào)用JanusGraph圖數(shù)據(jù)庫(kù)查詢API完成智能語(yǔ)義查詢。本發(fā)明以知識(shí)圖譜為基礎(chǔ),以文書(shū)檔案的事件概念為核心,挖掘文書(shū)檔案的文書(shū)信息和文書(shū)內(nèi)容的知識(shí),構(gòu)建文書(shū)檔案事件知識(shí)圖譜,通過(guò)構(gòu)建知識(shí)存儲(chǔ)模塊和知識(shí)查詢模塊提供文書(shū)檔案基于語(yǔ)義的檢索方式,提升了文書(shū)檔案檢索效率。