一種實(shí)體信息圖譜生成方法及裝置
基本信息
申請(qǐng)?zhí)?/td> | CN201410421859.X | 申請(qǐng)日 | - |
公開(kāi)(公告)號(hào) | CN105468605A | 公開(kāi)(公告)日 | 2016-04-06 |
申請(qǐng)公布號(hào) | CN105468605A | 申請(qǐng)公布日 | 2016-04-06 |
分類(lèi)號(hào) | G06F17/30(2006.01)I | 分類(lèi) | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 李曉戈;李宗海;高劍凌 | 申請(qǐng)(專(zhuān)利權(quán))人 | 濟(jì)南中林信息科技有限公司 |
代理機(jī)構(gòu) | 北京元本知識(shí)產(chǎn)權(quán)代理事務(wù)所 | 代理人 | 濟(jì)南中林信息科技有限公司 |
地址 | 250101 山東省濟(jì)南市高新區(qū)舜風(fēng)路322號(hào)1號(hào)樓413 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開(kāi)了一種實(shí)體信息圖譜生成方法及裝置,所述方法包括:采集文本文件;根據(jù)預(yù)先定義的類(lèi)別名和關(guān)系字,從各文本文件中分別抽取與各個(gè)類(lèi)別名相關(guān)的命名實(shí)體,以及與各個(gè)關(guān)系字相關(guān)的命名實(shí)體的屬性;根據(jù)所述命名實(shí)體的屬性,對(duì)所采集的各文本文件中的命名實(shí)體分別進(jìn)行關(guān)聯(lián)性處理,得到各個(gè)命名實(shí)體之間的實(shí)體關(guān)系;根據(jù)預(yù)定義事件名,查找與其有關(guān)的命名實(shí)體,并將預(yù)定義事件名與查找到的命名實(shí)體進(jìn)行綁定;以所述預(yù)定義事件名為線索,根據(jù)所抽取的命名實(shí)體以及所述實(shí)體關(guān)系,通過(guò)將分散在所述各個(gè)文本文件中相關(guān)信息建立映射,使其聚合在一起,形成實(shí)體信息圖譜。本發(fā)明能夠?qū)⒎墙Y(jié)構(gòu)化文本數(shù)據(jù)轉(zhuǎn)化為結(jié)構(gòu)化數(shù)據(jù),實(shí)現(xiàn)多維復(fù)雜的知識(shí)圖譜。 |
