一種基于標注的事件抽取方法

基本信息

申請?zhí)?/td> CN201811400437.9 申請日 -
公開(公告)號 CN109635280A 公開(公告)日 2019-04-16
申請公布號 CN109635280A 申請公布日 2019-04-16
分類號 G06F17/27(2006.01)I; G06N3/04(2006.01)I 分類 計算;推算;計數(shù);
發(fā)明人 王家奎 申請(專利權(quán))人 園寶科技(武漢)有限公司
代理機構(gòu) 武漢東喻專利代理事務(wù)所(普通合伙) 代理人 趙偉
地址 430000 湖北省武漢市江夏區(qū)華中科大科技園創(chuàng)新基地17號樓B座306
法律狀態(tài) -

摘要

摘要 本發(fā)明屬于信息抽取技術(shù)領(lǐng)域,公開了一種基于標注的事件抽取方法,結(jié)合標注與神經(jīng)網(wǎng)絡(luò)來進行事件抽取,首先進行數(shù)據(jù)處理得到一個事件實體的標注標簽,然后用神經(jīng)網(wǎng)絡(luò)來訓(xùn)練標注好的數(shù)據(jù),得到結(jié)構(gòu)化的事件抽取的結(jié)果;對于輸入的句子,通過實體識別和基于神經(jīng)網(wǎng)絡(luò)的事件抽取模型,直接得到有事件的實體標簽;本發(fā)明提供的方法由于可直接得到有事件的實體標簽,因此不會造成錯誤傳遞,沒有冗余信息,有效降低錯誤率;另一方面本發(fā)明提供的基于標注的事件抽取方法,通過改進類別的權(quán)重的方式來得到損失函數(shù),可緩解類別不平衡所引起的模型傾向預(yù)測較多數(shù)據(jù)類別。