一種RDF數(shù)據(jù)冗余語(yǔ)義的檢測(cè)方法
基本信息
申請(qǐng)?zhí)?/td> | CN202210275049.2 | 申請(qǐng)日 | - |
公開(kāi)(公告)號(hào) | CN114692646A | 公開(kāi)(公告)日 | 2022-07-01 |
申請(qǐng)公布號(hào) | CN114692646A | 申請(qǐng)公布日 | 2022-07-01 |
分類號(hào) | G06F40/30(2020.01)I;G06F40/289(2020.01)I;G06K9/62(2022.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 陳一鳴;嚴(yán)麗 | 申請(qǐng)(專利權(quán))人 | 南京航空航天大學(xué) |
代理機(jī)構(gòu) | 南京瑞弘專利商標(biāo)事務(wù)所(普通合伙) | 代理人 | - |
地址 | 210016江蘇省南京市秦淮區(qū)御道街29號(hào) | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開(kāi)了一種RDF數(shù)據(jù)冗余語(yǔ)義的檢測(cè)方法。RDF是知識(shí)圖譜的一種表示模型,為實(shí)現(xiàn)對(duì)以RDF表示的知識(shí)圖譜進(jìn)行冗余語(yǔ)義的檢測(cè),本發(fā)明在總結(jié)和分析現(xiàn)有的RDF冗余語(yǔ)義檢測(cè)方法的基礎(chǔ)上,改進(jìn)了RDF相似度算法,對(duì)不同語(yǔ)義信息對(duì)相似度的貢獻(xiàn)做出了權(quán)值設(shè)計(jì),且權(quán)值設(shè)置是領(lǐng)域獨(dú)立的和自動(dòng)化的。并且該算法在語(yǔ)義信息的表示中還設(shè)計(jì)了剪枝技術(shù),有效提高了相似性計(jì)算的速度。此外在相似度算法的基礎(chǔ)上,本發(fā)明還提出了一種篩選候選對(duì)象的選擇方法,用于尋找數(shù)據(jù)集中近似的候選數(shù)據(jù)。該方法是基于局部敏感哈希算法的,該算法能有效解決大規(guī)模RDF數(shù)據(jù)線性搜索帶來(lái)的時(shí)間復(fù)雜度高的問(wèn)題,具有良好的時(shí)間性能。 |
