一種基于BERT類模型的閱讀理解式新聞文本事件抽取方法

基本信息

申請?zhí)?/td> CN202011501132.4 申請日 -
公開(公告)號 CN112612885A 公開(公告)日 2021-04-06
申請公布號 CN112612885A 申請公布日 2021-04-06
分類號 G06K9/62(2006.01)I;G06F16/34(2019.01)I;G06F16/35(2019.01)I 分類 計算;推算;計數(shù);
發(fā)明人 賈宇;郭先會;張明亮;董弋粲;蔣彧忱;沈宜 申請(專利權(quán))人 成都三零凱天通信實業(yè)有限公司
代理機(jī)構(gòu) 成都九鼎天元知識產(chǎn)權(quán)代理有限公司 代理人 徐靜
地址 610041四川省成都市高新區(qū)云華路333號1棟5單元4至8層
法律狀態(tài) -

摘要

摘要 本發(fā)明提供的一種基于BERT類模型的閱讀理解式新聞文本事件抽取方法包括:收集中文新聞文本語料,并獲得事件類型表和論元表;將事件類型表和論元表排序;根據(jù)論元表設(shè)計不同問題;劃分訓(xùn)練集、驗證集和測試集;標(biāo)注標(biāo)訓(xùn)練集和驗證集;利用訓(xùn)練集和驗證集輸入BERT類模型進(jìn)行訓(xùn)練和驗證,分別得到事件類型多分類模型、問題有無答案的二分類模型以及論元抽取模型;使用事件類型多分類模型、問題有無答案的二分類模型以及論元抽取模型對測試集做預(yù)測,得到測試集的事件類型以及對應(yīng)的論元抽取的預(yù)測結(jié)果。本發(fā)明將事件抽取任務(wù)轉(zhuǎn)化為機(jī)器閱讀理解任務(wù),提高了事件抽取的準(zhǔn)確性,并且能夠根據(jù)不同的需求設(shè)計不同的事件類型以及關(guān)注的論元,泛化能力強(qiáng)。??