一種實體信息圖譜生成方法及裝置

基本信息

申請?zhí)?/td> CN201410421859.X 申請日 -
公開(公告)號 CN105468605B 公開(公告)日 2019-04-12
申請公布號 CN105468605B 申請公布日 2019-04-12
分類號 G06F16/36;G06F16/951;G06F16/953;G06F17/27 分類 計算;推算;計數(shù);
發(fā)明人 李曉戈;李宗海;高劍凌 申請(專利權(quán))人 濟南中林信息科技有限公司
代理機構(gòu) 北京元本知識產(chǎn)權(quán)代理事務所 代理人 濟南中林信息科技有限公司
地址 250101 山東省濟南市高新區(qū)舜風路322號1號樓413
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種實體信息圖譜生成方法及裝置,所述方法包括:采集文本文件;根據(jù)預先定義的類別名和關系字,從各文本文件中分別抽取與各個類別名相關的命名實體,以及與各個關系字相關的命名實體的屬性;根據(jù)所述命名實體的屬性,對所采集的各文本文件中的命名實體分別進行關聯(lián)性處理,得到各個命名實體之間的實體關系;根據(jù)預定義事件名,查找與其有關的命名實體,并將預定義事件名與查找到的命名實體進行綁定;以所述預定義事件名為線索,根據(jù)所抽取的命名實體以及所述實體關系,通過將分散在所述各個文本文件中相關信息建立映射,使其聚合在一起,形成實體信息圖譜。本發(fā)明能夠?qū)⒎墙Y(jié)構(gòu)化文本數(shù)據(jù)轉(zhuǎn)化為結(jié)構(gòu)化數(shù)據(jù),實現(xiàn)多維復雜的知識圖譜。