一種基于標注的事件抽取方法

基本信息

申請?zhí)?/td> CN201811400437.9 申請日 -
公開(公告)號 CN109635280A 公開(公告)日 2019-04-16
申請公布號 CN109635280A 申請公布日 2019-04-16
分類號 G06F17/27(2006.01)I; G06N3/04(2006.01)I 分類 計算;推算;計數(shù);
發(fā)明人 王家奎 申請(專利權)人 園寶科技(武漢)有限公司
代理機構 武漢東喻專利代理事務所(普通合伙) 代理人 趙偉
地址 430000 湖北省武漢市江夏區(qū)華中科大科技園創(chuàng)新基地17號樓B座306
法律狀態(tài) -

摘要

摘要 本發(fā)明屬于信息抽取技術領域,公開了一種基于標注的事件抽取方法,結合標注與神經(jīng)網(wǎng)絡來進行事件抽取,首先進行數(shù)據(jù)處理得到一個事件實體的標注標簽,然后用神經(jīng)網(wǎng)絡來訓練標注好的數(shù)據(jù),得到結構化的事件抽取的結果;對于輸入的句子,通過實體識別和基于神經(jīng)網(wǎng)絡的事件抽取模型,直接得到有事件的實體標簽;本發(fā)明提供的方法由于可直接得到有事件的實體標簽,因此不會造成錯誤傳遞,沒有冗余信息,有效降低錯誤率;另一方面本發(fā)明提供的基于標注的事件抽取方法,通過改進類別的權重的方式來得到損失函數(shù),可緩解類別不平衡所引起的模型傾向預測較多數(shù)據(jù)類別。