一種基于企業(yè)關(guān)聯(lián)關(guān)系的人名消歧方法及系統(tǒng)
基本信息
申請(qǐng)?zhí)?/td> | CN202110616330.3 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN113326377A | 公開(公告)日 | 2021-08-31 |
申請(qǐng)公布號(hào) | CN113326377A | 申請(qǐng)公布日 | 2021-08-31 |
分類號(hào) | G06F16/35(2019.01)I;G06F16/36(2019.01)I;G06N20/00(2019.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 丁凱;尹杰;張彬;郭豐俊;龍騰;鎮(zhèn)立新 | 申請(qǐng)(專利權(quán))人 | 上海生騰數(shù)據(jù)科技有限公司 |
代理機(jī)構(gòu) | 上海雙霆知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) | 代理人 | 殷曉雪 |
地址 | 200436上海市靜安區(qū)萬榮路1256、1258號(hào)1101室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本申請(qǐng)公開了一種基于企業(yè)關(guān)聯(lián)關(guān)系的人名消歧方法。構(gòu)建反映企業(yè)關(guān)聯(lián)關(guān)系的知識(shí)圖譜。將知識(shí)圖譜劃分為一個(gè)或多個(gè)連通子圖。根據(jù)查詢時(shí)輸入的人名以及企業(yè)名,在各連通子圖中查找查詢輸入企業(yè)節(jié)點(diǎn);在具有查詢輸入企業(yè)節(jié)點(diǎn)的連通子圖中生成查詢輸入個(gè)人節(jié)點(diǎn);在該連通子圖中,尋找查詢輸入個(gè)人節(jié)點(diǎn)的所有同名個(gè)人節(jié)點(diǎn),將路徑最短的前k個(gè)樣本輸入預(yù)定義或已訓(xùn)練好的判別模型,得到唯一候選同名節(jié)點(diǎn)對(duì)。若判別模型輸出的唯一的候選同名節(jié)點(diǎn)對(duì)的預(yù)測(cè)值大于某閾值,則判定該候選同名節(jié)點(diǎn)對(duì)中的兩個(gè)同名的個(gè)人節(jié)點(diǎn)為同一自然人。本申請(qǐng)使用多種不同策略方法對(duì)目標(biāo)同名個(gè)人節(jié)點(diǎn)對(duì)進(jìn)行人名消歧。 |
