一種基于企業(yè)關(guān)聯(lián)關(guān)系的人名消歧方法及系統(tǒng)
基本信息
申請?zhí)?/td> | CN202110616330.3 | 申請日 | - |
公開(公告)號 | CN113326377A | 公開(公告)日 | 2021-08-31 |
申請公布號 | CN113326377A | 申請公布日 | 2021-08-31 |
分類號 | G06F16/35(2019.01)I;G06F16/36(2019.01)I;G06N20/00(2019.01)I | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 丁凱;尹杰;張彬;郭豐俊;龍騰;鎮(zhèn)立新 | 申請(專利權(quán))人 | 上海臨冠數(shù)據(jù)科技有限公司 |
代理機構(gòu) | 上海雙霆知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) | 代理人 | 殷曉雪 |
地址 | 200436上海市靜安區(qū)萬榮路1256、1258號1101室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本申請公開了一種基于企業(yè)關(guān)聯(lián)關(guān)系的人名消歧方法。構(gòu)建反映企業(yè)關(guān)聯(lián)關(guān)系的知識圖譜。將知識圖譜劃分為一個或多個連通子圖。根據(jù)查詢時輸入的人名以及企業(yè)名,在各連通子圖中查找查詢輸入企業(yè)節(jié)點;在具有查詢輸入企業(yè)節(jié)點的連通子圖中生成查詢輸入個人節(jié)點;在該連通子圖中,尋找查詢輸入個人節(jié)點的所有同名個人節(jié)點,將路徑最短的前k個樣本輸入預(yù)定義或已訓(xùn)練好的判別模型,得到唯一候選同名節(jié)點對。若判別模型輸出的唯一的候選同名節(jié)點對的預(yù)測值大于某閾值,則判定該候選同名節(jié)點對中的兩個同名的個人節(jié)點為同一自然人。本申請使用多種不同策略方法對目標同名個人節(jié)點對進行人名消歧。 |
