一種基于深度學(xué)習(xí)和規(guī)則引擎的文本信息抽取方法及系統(tǒng)
基本信息
申請(qǐng)?zhí)?/td> | CN202010449750.2 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN111538805A | 公開(公告)日 | 2020-08-14 |
申請(qǐng)公布號(hào) | CN111538805A | 申請(qǐng)公布日 | 2020-08-14 |
分類號(hào) | G06F16/31(2019.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 金勇;朱其斯;胡華;孫濤 | 申請(qǐng)(專利權(quán))人 | 武漢烽火普天信息技術(shù)有限公司 |
代理機(jī)構(gòu) | 上海精晟知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | 武漢烽火普天信息技術(shù)有限公司 |
地址 | 430000湖北省武漢市東湖開發(fā)區(qū)關(guān)山二路附4號(hào) | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明涉及一種基于深度學(xué)習(xí)和規(guī)則引擎的文本信息抽取方法及系統(tǒng),所述方法具體包括以下步驟:S1:將輸入的公安文檔解析成可處理文本,并進(jìn)行無用字符清洗及段落切割;S2:針對(duì)切割后的段落,抽取段落中所有出現(xiàn)的涉案涉線人員姓名與地址信息;S3:采用規(guī)則引擎抽取文檔中涉案涉線人員相關(guān)屬性,同時(shí)利用時(shí)間識(shí)別算法抽取段落中包含的線索信息;S4:通過語義理解模塊確定S3中抽取的人員、線索信息對(duì)應(yīng)關(guān)系,并進(jìn)行人員稱呼消歧及多關(guān)系融合,最后輸出結(jié)構(gòu)化結(jié)果。本申請(qǐng)的文本信息抽取方法和系統(tǒng),采用深度學(xué)習(xí)模型與規(guī)則引擎相結(jié)合,促進(jìn)非結(jié)構(gòu)化文檔信息的利用,實(shí)現(xiàn)人員與線索的快速相關(guān)聯(lián),提升公安民警的判案效率。?? |
