一種裁判文書實(shí)體關(guān)系抽取方法及系統(tǒng)
基本信息
申請?zhí)?/td> | CN201911082739.0 | 申請日 | - |
公開(公告)號 | CN110837558A | 公開(公告)日 | 2020-02-25 |
申請公布號 | CN110837558A | 申請公布日 | 2020-02-25 |
分類號 | G06F16/35;G06F40/295 | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 不公告發(fā)明人 | 申請(專利權(quán))人 | 成都星云律例科技有限責(zé)任公司 |
代理機(jī)構(gòu) | 成都行之專利代理事務(wù)所(普通合伙) | 代理人 | 熊曦 |
地址 | 610000 四川省成都市高新區(qū)錦暉西一街99號2棟1單元19樓1909號 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種裁判文書實(shí)體關(guān)系抽取方法及系統(tǒng),所述方法包括:設(shè)定樣本數(shù)據(jù)的格式;將訓(xùn)練樣本的格式轉(zhuǎn)換為樣本數(shù)據(jù)的格式,獲得格式轉(zhuǎn)換后的訓(xùn)練樣本;利用格式轉(zhuǎn)換后的訓(xùn)練樣本訓(xùn)練預(yù)訓(xùn)練模型bert,獲得訓(xùn)練后的模型bert;將待抽取實(shí)體關(guān)系的裁判文書句子輸入訓(xùn)練后的模型bert,輸出裁判文書句子中兩個實(shí)體之間的關(guān)系;在同等數(shù)據(jù)量情況下,本方法及系統(tǒng)效果優(yōu)于其他關(guān)系抽取模型;本方法及系統(tǒng)使用句子信息、實(shí)體信息、實(shí)體位置信息以及實(shí)體類型信息在模型中間拼接,符合關(guān)系抽取三元組的天然結(jié)構(gòu)。 |
