一種基于多數(shù)據(jù)源的知識(shí)圖譜人物實(shí)體對(duì)齊方法
基本信息
申請(qǐng)?zhí)?/td> | CN201810385484.4 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN108717425A | 公開(公告)日 | 2018-10-30 |
申請(qǐng)公布號(hào) | CN108717425A | 申請(qǐng)公布日 | 2018-10-30 |
分類號(hào) | G06F17/30 | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 劉前衛(wèi);盛興;趙焱;劉廣峰;張渝;張濤;周莉;聶慶;謝秋學(xué);雍志娟;賀芳;孫金;吳培培;滕家雨;張楠;商瑩楠;王光林;劉斌;季笑慶;張婷婷 | 申請(qǐng)(專利權(quán))人 | 英大傳媒投資集團(tuán)有限公司 |
代理機(jī)構(gòu) | 南京蘇高專利商標(biāo)事務(wù)所(普通合伙) | 代理人 | 國(guó)家電網(wǎng)公司;英大傳媒投資集團(tuán)有限公司;南瑞集團(tuán)有限公司;國(guó)網(wǎng)山東省電力公司煙臺(tái)供電公司 |
地址 | 100031 北京市西城區(qū)西長(zhǎng)安街86號(hào) | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種基于多數(shù)據(jù)源的知識(shí)圖譜人物實(shí)體對(duì)齊方法,該方法首先從知識(shí)圖譜中將同名的人物實(shí)體規(guī)約在一起,然后對(duì)兩個(gè)及以上相同名字的實(shí)體相互之間進(jìn)行比較,計(jì)算兩者之間相似度,設(shè)置相應(yīng)的閾值區(qū)間[a,b],相似度大于b則判斷是相同的實(shí)體,如果相似度大于a而小于b則加入到人工確認(rèn)合并候選集,由人工進(jìn)行確認(rèn),如果相似度小于a,則直接判定為不同實(shí)體。本發(fā)明在本體信息不完備的情形下進(jìn)行人物實(shí)體合并,通過利用百科知識(shí)庫(kù)、基于共同發(fā)文網(wǎng)絡(luò)關(guān)系和研究領(lǐng)域相似度的方法進(jìn)行加權(quán)求和,最后綜合判斷,且加權(quán)參數(shù)根據(jù)機(jī)器學(xué)習(xí)的結(jié)果實(shí)時(shí)更新,機(jī)器自主學(xué)習(xí),讓結(jié)果更加精準(zhǔn)。 |
