一種基于標注的事件抽取方法
基本信息
申請?zhí)?/td> | CN201811400437.9 | 申請日 | - |
公開(公告)號 | CN109635280A | 公開(公告)日 | 2019-04-16 |
申請公布號 | CN109635280A | 申請公布日 | 2019-04-16 |
分類號 | G06F17/27(2006.01)I; G06N3/04(2006.01)I | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 王家奎 | 申請(專利權)人 | 園寶科技(武漢)有限公司 |
代理機構 | 武漢東喻專利代理事務所(普通合伙) | 代理人 | 趙偉 |
地址 | 430000 湖北省武漢市江夏區(qū)華中科大科技園創(chuàng)新基地17號樓B座306 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明屬于信息抽取技術領域,公開了一種基于標注的事件抽取方法,結合標注與神經(jīng)網(wǎng)絡來進行事件抽取,首先進行數(shù)據(jù)處理得到一個事件實體的標注標簽,然后用神經(jīng)網(wǎng)絡來訓練標注好的數(shù)據(jù),得到結構化的事件抽取的結果;對于輸入的句子,通過實體識別和基于神經(jīng)網(wǎng)絡的事件抽取模型,直接得到有事件的實體標簽;本發(fā)明提供的方法由于可直接得到有事件的實體標簽,因此不會造成錯誤傳遞,沒有冗余信息,有效降低錯誤率;另一方面本發(fā)明提供的基于標注的事件抽取方法,通過改進類別的權重的方式來得到損失函數(shù),可緩解類別不平衡所引起的模型傾向預測較多數(shù)據(jù)類別。 |
