一種基于BERT類模型的閱讀理解式新聞文本事件抽取方法
基本信息
申請?zhí)?/td> | CN202011501132.4 | 申請日 | - |
公開(公告)號 | CN112612885A | 公開(公告)日 | 2021-04-06 |
申請公布號 | CN112612885A | 申請公布日 | 2021-04-06 |
分類號 | G06K9/62(2006.01)I;G06F16/34(2019.01)I;G06F16/35(2019.01)I | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 賈宇;郭先會;張明亮;董弋粲;蔣彧忱;沈宜 | 申請(專利權)人 | 成都三零凱天通信實業(yè)有限公司 |
代理機構 | 成都九鼎天元知識產(chǎn)權代理有限公司 | 代理人 | 徐靜 |
地址 | 610041四川省成都市高新區(qū)云華路333號1棟5單元4至8層 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明提供的一種基于BERT類模型的閱讀理解式新聞文本事件抽取方法包括:收集中文新聞文本語料,并獲得事件類型表和論元表;將事件類型表和論元表排序;根據(jù)論元表設計不同問題;劃分訓練集、驗證集和測試集;標注標訓練集和驗證集;利用訓練集和驗證集輸入BERT類模型進行訓練和驗證,分別得到事件類型多分類模型、問題有無答案的二分類模型以及論元抽取模型;使用事件類型多分類模型、問題有無答案的二分類模型以及論元抽取模型對測試集做預測,得到測試集的事件類型以及對應的論元抽取的預測結果。本發(fā)明將事件抽取任務轉化為機器閱讀理解任務,提高了事件抽取的準確性,并且能夠根據(jù)不同的需求設計不同的事件類型以及關注的論元,泛化能力強。?? |
