一種基于企業(yè)關(guān)聯(lián)關(guān)系的人名消歧方法及系統(tǒng)

基本信息

申請(qǐng)?zhí)?/td> CN202110616330.3 申請(qǐng)日 -
公開(公告)號(hào) CN113326377A 公開(公告)日 2021-08-31
申請(qǐng)公布號(hào) CN113326377A 申請(qǐng)公布日 2021-08-31
分類號(hào) G06F16/35(2019.01)I;G06F16/36(2019.01)I;G06N20/00(2019.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 丁凱;尹杰;張彬;郭豐俊;龍騰;鎮(zhèn)立新 申請(qǐng)(專利權(quán))人 上海生騰數(shù)據(jù)科技有限公司
代理機(jī)構(gòu) 上海雙霆知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 殷曉雪
地址 200436上海市靜安區(qū)萬榮路1256、1258號(hào)1101室
法律狀態(tài) -

摘要

摘要 本申請(qǐng)公開了一種基于企業(yè)關(guān)聯(lián)關(guān)系的人名消歧方法。構(gòu)建反映企業(yè)關(guān)聯(lián)關(guān)系的知識(shí)圖譜。將知識(shí)圖譜劃分為一個(gè)或多個(gè)連通子圖。根據(jù)查詢時(shí)輸入的人名以及企業(yè)名,在各連通子圖中查找查詢輸入企業(yè)節(jié)點(diǎn);在具有查詢輸入企業(yè)節(jié)點(diǎn)的連通子圖中生成查詢輸入個(gè)人節(jié)點(diǎn);在該連通子圖中,尋找查詢輸入個(gè)人節(jié)點(diǎn)的所有同名個(gè)人節(jié)點(diǎn),將路徑最短的前k個(gè)樣本輸入預(yù)定義或已訓(xùn)練好的判別模型,得到唯一候選同名節(jié)點(diǎn)對(duì)。若判別模型輸出的唯一的候選同名節(jié)點(diǎn)對(duì)的預(yù)測(cè)值大于某閾值,則判定該候選同名節(jié)點(diǎn)對(duì)中的兩個(gè)同名的個(gè)人節(jié)點(diǎn)為同一自然人。本申請(qǐng)使用多種不同策略方法對(duì)目標(biāo)同名個(gè)人節(jié)點(diǎn)對(duì)進(jìn)行人名消歧。