一種實體關(guān)系聯(lián)合抽取方法及裝置

基本信息

申請?zhí)?/td> CN202110340031.1 申請日 -
公開(公告)號 CN112926332A 公開(公告)日 2021-06-08
申請公布號 CN112926332A 申請公布日 2021-06-08
分類號 G06F40/295;G06F16/35;G16H50/20 分類 計算;推算;計數(shù);
發(fā)明人 陳培華 申請(專利權(quán))人 善診(上海)信息技術(shù)有限公司
代理機構(gòu) 北京三友知識產(chǎn)權(quán)代理有限公司 代理人 許曼;賈磊
地址 201203 上海市浦東新區(qū)祖沖之路2290弄9號樓
法律狀態(tài) -

摘要

摘要 本文提供了一種實體關(guān)系聯(lián)合抽取方法及裝置,其中,方法包括:獲取待預(yù)測文本數(shù)據(jù);利用預(yù)先建立的實體關(guān)系聯(lián)合抽取模型對待預(yù)測文本數(shù)據(jù)進行抽取,預(yù)測得到詞例區(qū)間的類型及實體詞組的關(guān)系類型,詞例區(qū)間的類型包括實體類型及非實體類型,實體詞為實體類型的詞例區(qū)間,實體詞組的關(guān)系類型包括關(guān)系及非關(guān)系;其中,實體關(guān)系聯(lián)合抽取模型用于對文本數(shù)據(jù)進行預(yù)處理;根據(jù)預(yù)處理得到的信息,預(yù)測得到詞例區(qū)間的類型;根據(jù)實體詞組及實體詞組中實體詞之間文字向量,預(yù)測得到實體詞組的關(guān)系類型。本文通過考慮實體詞組及實體詞組中實體詞之間文字向量,充實了文本語義信息,能夠精確地提取出復(fù)雜文本數(shù)據(jù)的全部實體詞組關(guān)系類型。