一種實體抽取的方法及裝置

基本信息

申請?zhí)?/td> CN201710186520.X 申請日 -
公開(公告)號 CN107133208A 公開(公告)日 2017-09-05
申請公布號 CN107133208A 申請公布日 2017-09-05
分類號 G06F17/27(2006.01)I 分類 計算;推算;計數(shù);
發(fā)明人 吳剛 申請(專利權)人 南京柯基數(shù)據(jù)科技有限公司
代理機構 北京東方億思知識產(chǎn)權代理有限責任公司 代理人 南京緣長信息科技有限公司;南京柯基數(shù)據(jù)科技有限公司
地址 211100 江蘇省南京市江寧經(jīng)濟技術開發(fā)區(qū)東吉大道1號
法律狀態(tài) -

摘要

摘要 本發(fā)明實施例公開了一種實體抽取方法及裝置,該方法包括:確定目標文本的實體關系詞,目標文本包括與預定實體相關的信息;抽取目標文本中的表格,以及與表格一一對應的表格描述;基于實體關系詞從表格描述中篩選目標表格描述;將目標表格描述對應的表格確定為待抽取表格;基于待抽取表格的內容確定待抽取表格中記錄待抽取實體的列或行;抽取記錄待抽取實體的列或行中的目標數(shù)據(jù),將目標數(shù)據(jù)作為待抽取實體。本發(fā)明能夠解決當用戶需要從面對大量的文本信息中獲取指定的信息時,現(xiàn)有技術中的方法浪費人力和時間,降低工作的效率的問題。