一種基于BERT類模型的閱讀理解式新聞文本事件抽取方法

基本信息

申請?zhí)?/td> CN202011501132.4 申請日 -
公開(公告)號 CN112612885A 公開(公告)日 2021-04-06
申請公布號 CN112612885A 申請公布日 2021-04-06
分類號 G06K9/62(2006.01)I;G06F16/34(2019.01)I;G06F16/35(2019.01)I 分類 計算;推算;計數(shù);
發(fā)明人 賈宇;郭先會;張明亮;董弋粲;蔣彧忱;沈宜 申請(專利權)人 成都三零凱天通信實業(yè)有限公司
代理機構 成都九鼎天元知識產(chǎn)權代理有限公司 代理人 徐靜
地址 610041四川省成都市高新區(qū)云華路333號1棟5單元4至8層
法律狀態(tài) -

摘要

摘要 本發(fā)明提供的一種基于BERT類模型的閱讀理解式新聞文本事件抽取方法包括:收集中文新聞文本語料,并獲得事件類型表和論元表;將事件類型表和論元表排序;根據(jù)論元表設計不同問題;劃分訓練集、驗證集和測試集;標注標訓練集和驗證集;利用訓練集和驗證集輸入BERT類模型進行訓練和驗證,分別得到事件類型多分類模型、問題有無答案的二分類模型以及論元抽取模型;使用事件類型多分類模型、問題有無答案的二分類模型以及論元抽取模型對測試集做預測,得到測試集的事件類型以及對應的論元抽取的預測結果。本發(fā)明將事件抽取任務轉化為機器閱讀理解任務,提高了事件抽取的準確性,并且能夠根據(jù)不同的需求設計不同的事件類型以及關注的論元,泛化能力強。??