一種實(shí)體關(guān)系抽取方法

基本信息

申請?zhí)?/td> CN202010869904.3 申請日 -
公開(公告)號 CN111984790A 公開(公告)日 2020-11-24
申請公布號 CN111984790A 申請公布日 2020-11-24
分類號 G06F16/35;G06F40/295;G06F40/216;G06N3/08 分類 計算;推算;計數(shù);
發(fā)明人 張雨豪;吳剛 申請(專利權(quán))人 南京柯基數(shù)據(jù)科技有限公司
代理機(jī)構(gòu) 江蘇瑞途律師事務(wù)所 代理人 南京柯基數(shù)據(jù)科技有限公司
地址 221000 江蘇省南京市江寧經(jīng)濟(jì)技術(shù)開發(fā)區(qū)東吉大道1號
法律狀態(tài) -

摘要

摘要 本發(fā)明提出了一種實(shí)體關(guān)系抽取方法,屬于實(shí)體關(guān)系抽取領(lǐng)域,本發(fā)明的方法為:構(gòu)建語料庫;選取語料庫的數(shù)據(jù)進(jìn)行標(biāo)注得到標(biāo)注數(shù)據(jù)集;并根據(jù)語料庫構(gòu)建正則模板,再通過正則模板對語料庫的數(shù)據(jù)進(jìn)行標(biāo)注得到擴(kuò)充數(shù)據(jù)集;將標(biāo)注數(shù)據(jù)集和擴(kuò)充數(shù)據(jù)集分為訓(xùn)練集和測試集;利用訓(xùn)練集訓(xùn)練神經(jīng)網(wǎng)絡(luò)模型,再利用訓(xùn)練后的神經(jīng)網(wǎng)絡(luò)模型對測試集進(jìn)行處理得到關(guān)系分類結(jié)果;利用正則模板對測試集進(jìn)行匹配得到分類結(jié)果;根據(jù)關(guān)系分類結(jié)果和匹配分類結(jié)果得到最終關(guān)系抽取結(jié)果。本發(fā)明克服了現(xiàn)有技術(shù)中僅使用神經(jīng)網(wǎng)絡(luò)模型進(jìn)行實(shí)體關(guān)系抽取,抽取時標(biāo)注數(shù)據(jù)量較少且抽取效果不佳的不足,本發(fā)明通過利用正則模板可以擴(kuò)充標(biāo)注數(shù)據(jù)量,并且可提高實(shí)體關(guān)系抽取的效果。