一種RDF數(shù)據(jù)冗余語(yǔ)義的檢測(cè)方法

基本信息

申請(qǐng)?zhí)?/td> CN202210275049.2 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN114692646A 公開(kāi)(公告)日 2022-07-01
申請(qǐng)公布號(hào) CN114692646A 申請(qǐng)公布日 2022-07-01
分類號(hào) G06F40/30(2020.01)I;G06F40/289(2020.01)I;G06K9/62(2022.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 陳一鳴;嚴(yán)麗 申請(qǐng)(專利權(quán))人 南京航空航天大學(xué)
代理機(jī)構(gòu) 南京瑞弘專利商標(biāo)事務(wù)所(普通合伙) 代理人 -
地址 210016江蘇省南京市秦淮區(qū)御道街29號(hào)
法律狀態(tài) -

摘要

摘要 本發(fā)明公開(kāi)了一種RDF數(shù)據(jù)冗余語(yǔ)義的檢測(cè)方法。RDF是知識(shí)圖譜的一種表示模型,為實(shí)現(xiàn)對(duì)以RDF表示的知識(shí)圖譜進(jìn)行冗余語(yǔ)義的檢測(cè),本發(fā)明在總結(jié)和分析現(xiàn)有的RDF冗余語(yǔ)義檢測(cè)方法的基礎(chǔ)上,改進(jìn)了RDF相似度算法,對(duì)不同語(yǔ)義信息對(duì)相似度的貢獻(xiàn)做出了權(quán)值設(shè)計(jì),且權(quán)值設(shè)置是領(lǐng)域獨(dú)立的和自動(dòng)化的。并且該算法在語(yǔ)義信息的表示中還設(shè)計(jì)了剪枝技術(shù),有效提高了相似性計(jì)算的速度。此外在相似度算法的基礎(chǔ)上,本發(fā)明還提出了一種篩選候選對(duì)象的選擇方法,用于尋找數(shù)據(jù)集中近似的候選數(shù)據(jù)。該方法是基于局部敏感哈希算法的,該算法能有效解決大規(guī)模RDF數(shù)據(jù)線性搜索帶來(lái)的時(shí)間復(fù)雜度高的問(wèn)題,具有良好的時(shí)間性能。