知識庫同名實例混淆檢測的方法及裝置
基本信息
申請?zhí)?/td> | CN201610974455.2 | 申請日 | - |
公開(公告)號 | CN108009184B | 公開(公告)日 | 2021-08-27 |
申請公布號 | CN108009184B | 申請公布日 | 2021-08-27 |
分類號 | G06F16/36(2019.01)I;G06F16/35(2019.01)I | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 謝海華;黃肖俊;呂肖慶;湯幟 | 申請(專利權(quán))人 | 北京方正阿帕比技術(shù)有限公司 |
代理機構(gòu) | 北京同立鈞成知識產(chǎn)權(quán)代理有限公司 | 代理人 | 張蓮蓮;劉芳 |
地址 | 100871北京市海淀區(qū)成府路298號中關(guān)村方正大廈9層 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明實施例提供一種知識庫同名實例混淆檢測的方法及裝置。該方法包括:獲取文本庫,文本庫內(nèi)容與知識庫的內(nèi)容相關(guān);獲取第一目標,根據(jù)第一目標和文本庫,構(gòu)造第一目標對應的目標向量的集合;其中,每個目標向量的維數(shù)與文本庫中文本的個數(shù)相等,第一目標為知識庫中的任意一個實例;對各目標向量進行聚類分析,根據(jù)聚類分析的結(jié)果確定知識庫是否發(fā)生同名實例混淆。本發(fā)明實施例通過對知識庫中的多個第一目標進行自動檢測,來確定第一目標中是否混雜有其他同名實例的有序集合,從而實現(xiàn)對知識庫同名實例混淆的自動檢測,無需人工對每個第一目標進行核對,節(jié)省了大量的人力,且大大提高了檢測效率。 |
