一種實體信息圖譜生成方法及裝置
基本信息
申請?zhí)?/td> | CN201410421859.X | 申請日 | - |
公開(公告)號 | CN105468605A | 公開(公告)日 | 2016-04-06 |
申請公布號 | CN105468605A | 申請公布日 | 2016-04-06 |
分類號 | G06F17/30(2006.01)I | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 李曉戈;李宗海;高劍凌 | 申請(專利權(quán))人 | 山東領(lǐng)悟教育科技有限公司 |
代理機構(gòu) | 北京元本知識產(chǎn)權(quán)代理事務(wù)所 | 代理人 | 濟南中林信息科技有限公司 |
地址 | 250101 山東省濟南市高新區(qū)舜風(fēng)路322號1號樓413 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種實體信息圖譜生成方法及裝置,所述方法包括:采集文本文件;根據(jù)預(yù)先定義的類別名和關(guān)系字,從各文本文件中分別抽取與各個類別名相關(guān)的命名實體,以及與各個關(guān)系字相關(guān)的命名實體的屬性;根據(jù)所述命名實體的屬性,對所采集的各文本文件中的命名實體分別進行關(guān)聯(lián)性處理,得到各個命名實體之間的實體關(guān)系;根據(jù)預(yù)定義事件名,查找與其有關(guān)的命名實體,并將預(yù)定義事件名與查找到的命名實體進行綁定;以所述預(yù)定義事件名為線索,根據(jù)所抽取的命名實體以及所述實體關(guān)系,通過將分散在所述各個文本文件中相關(guān)信息建立映射,使其聚合在一起,形成實體信息圖譜。本發(fā)明能夠?qū)⒎墙Y(jié)構(gòu)化文本數(shù)據(jù)轉(zhuǎn)化為結(jié)構(gòu)化數(shù)據(jù),實現(xiàn)多維復(fù)雜的知識圖譜。 |
