一種實(shí)體關(guān)系抽取方法
基本信息
申請?zhí)?/td> | CN202010869904.3 | 申請日 | - |
公開(公告)號 | CN111984790A | 公開(公告)日 | 2020-11-24 |
申請公布號 | CN111984790A | 申請公布日 | 2020-11-24 |
分類號 | G06F16/35;G06F40/295;G06F40/216;G06N3/08 | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 張雨豪;吳剛 | 申請(專利權(quán))人 | 南京柯基數(shù)據(jù)科技有限公司 |
代理機(jī)構(gòu) | 江蘇瑞途律師事務(wù)所 | 代理人 | 南京柯基數(shù)據(jù)科技有限公司 |
地址 | 221000 江蘇省南京市江寧經(jīng)濟(jì)技術(shù)開發(fā)區(qū)東吉大道1號 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明提出了一種實(shí)體關(guān)系抽取方法,屬于實(shí)體關(guān)系抽取領(lǐng)域,本發(fā)明的方法為:構(gòu)建語料庫;選取語料庫的數(shù)據(jù)進(jìn)行標(biāo)注得到標(biāo)注數(shù)據(jù)集;并根據(jù)語料庫構(gòu)建正則模板,再通過正則模板對語料庫的數(shù)據(jù)進(jìn)行標(biāo)注得到擴(kuò)充數(shù)據(jù)集;將標(biāo)注數(shù)據(jù)集和擴(kuò)充數(shù)據(jù)集分為訓(xùn)練集和測試集;利用訓(xùn)練集訓(xùn)練神經(jīng)網(wǎng)絡(luò)模型,再利用訓(xùn)練后的神經(jīng)網(wǎng)絡(luò)模型對測試集進(jìn)行處理得到關(guān)系分類結(jié)果;利用正則模板對測試集進(jìn)行匹配得到分類結(jié)果;根據(jù)關(guān)系分類結(jié)果和匹配分類結(jié)果得到最終關(guān)系抽取結(jié)果。本發(fā)明克服了現(xiàn)有技術(shù)中僅使用神經(jīng)網(wǎng)絡(luò)模型進(jìn)行實(shí)體關(guān)系抽取,抽取時標(biāo)注數(shù)據(jù)量較少且抽取效果不佳的不足,本發(fā)明通過利用正則模板可以擴(kuò)充標(biāo)注數(shù)據(jù)量,并且可提高實(shí)體關(guān)系抽取的效果。 |
