一種基于深度學習和規(guī)則引擎的文本信息抽取方法及系統(tǒng)

基本信息

申請?zhí)?/td> CN202010449750.2 申請日 -
公開(公告)號 CN111538805A 公開(公告)日 2020-08-14
申請公布號 CN111538805A 申請公布日 2020-08-14
分類號 G06F16/31(2019.01)I 分類 計算;推算;計數(shù);
發(fā)明人 金勇;朱其斯;胡華;孫濤 申請(專利權)人 武漢烽火普天信息技術有限公司
代理機構 上海精晟知識產(chǎn)權代理有限公司 代理人 武漢烽火普天信息技術有限公司
地址 430000湖北省武漢市東湖開發(fā)區(qū)關山二路附4號
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及一種基于深度學習和規(guī)則引擎的文本信息抽取方法及系統(tǒng),所述方法具體包括以下步驟:S1:將輸入的公安文檔解析成可處理文本,并進行無用字符清洗及段落切割;S2:針對切割后的段落,抽取段落中所有出現(xiàn)的涉案涉線人員姓名與地址信息;S3:采用規(guī)則引擎抽取文檔中涉案涉線人員相關屬性,同時利用時間識別算法抽取段落中包含的線索信息;S4:通過語義理解模塊確定S3中抽取的人員、線索信息對應關系,并進行人員稱呼消歧及多關系融合,最后輸出結構化結果。本申請的文本信息抽取方法和系統(tǒng),采用深度學習模型與規(guī)則引擎相結合,促進非結構化文檔信息的利用,實現(xiàn)人員與線索的快速相關聯(lián),提升公安民警的判案效率。??