一種實(shí)體信息圖譜生成方法及裝置

基本信息

申請(qǐng)?zhí)?/td> CN201410421859.X 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN105468605A 公開(kāi)(公告)日 2016-04-06
申請(qǐng)公布號(hào) CN105468605A 申請(qǐng)公布日 2016-04-06
分類(lèi)號(hào) G06F17/30(2006.01)I 分類(lèi) 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 李曉戈;李宗海;高劍凌 申請(qǐng)(專(zhuān)利權(quán))人 濟(jì)南中林信息科技有限公司
代理機(jī)構(gòu) 北京元本知識(shí)產(chǎn)權(quán)代理事務(wù)所 代理人 濟(jì)南中林信息科技有限公司
地址 250101 山東省濟(jì)南市高新區(qū)舜風(fēng)路322號(hào)1號(hào)樓413
法律狀態(tài) -

摘要

摘要 本發(fā)明公開(kāi)了一種實(shí)體信息圖譜生成方法及裝置,所述方法包括:采集文本文件;根據(jù)預(yù)先定義的類(lèi)別名和關(guān)系字,從各文本文件中分別抽取與各個(gè)類(lèi)別名相關(guān)的命名實(shí)體,以及與各個(gè)關(guān)系字相關(guān)的命名實(shí)體的屬性;根據(jù)所述命名實(shí)體的屬性,對(duì)所采集的各文本文件中的命名實(shí)體分別進(jìn)行關(guān)聯(lián)性處理,得到各個(gè)命名實(shí)體之間的實(shí)體關(guān)系;根據(jù)預(yù)定義事件名,查找與其有關(guān)的命名實(shí)體,并將預(yù)定義事件名與查找到的命名實(shí)體進(jìn)行綁定;以所述預(yù)定義事件名為線索,根據(jù)所抽取的命名實(shí)體以及所述實(shí)體關(guān)系,通過(guò)將分散在所述各個(gè)文本文件中相關(guān)信息建立映射,使其聚合在一起,形成實(shí)體信息圖譜。本發(fā)明能夠?qū)⒎墙Y(jié)構(gòu)化文本數(shù)據(jù)轉(zhuǎn)化為結(jié)構(gòu)化數(shù)據(jù),實(shí)現(xiàn)多維復(fù)雜的知識(shí)圖譜。