一種裁判文書實(shí)體關(guān)系抽取方法及系統(tǒng)

基本信息

申請?zhí)?/td> CN201911082739.0 申請日 -
公開(公告)號 CN110837558A 公開(公告)日 2020-02-25
申請公布號 CN110837558A 申請公布日 2020-02-25
分類號 G06F16/35;G06F40/295 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 不公告發(fā)明人 申請(專利權(quán))人 成都星云律例科技有限責(zé)任公司
代理機(jī)構(gòu) 成都行之專利代理事務(wù)所(普通合伙) 代理人 熊曦
地址 610000 四川省成都市高新區(qū)錦暉西一街99號2棟1單元19樓1909號
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種裁判文書實(shí)體關(guān)系抽取方法及系統(tǒng),所述方法包括:設(shè)定樣本數(shù)據(jù)的格式;將訓(xùn)練樣本的格式轉(zhuǎn)換為樣本數(shù)據(jù)的格式,獲得格式轉(zhuǎn)換后的訓(xùn)練樣本;利用格式轉(zhuǎn)換后的訓(xùn)練樣本訓(xùn)練預(yù)訓(xùn)練模型bert,獲得訓(xùn)練后的模型bert;將待抽取實(shí)體關(guān)系的裁判文書句子輸入訓(xùn)練后的模型bert,輸出裁判文書句子中兩個實(shí)體之間的關(guān)系;在同等數(shù)據(jù)量情況下,本方法及系統(tǒng)效果優(yōu)于其他關(guān)系抽取模型;本方法及系統(tǒng)使用句子信息、實(shí)體信息、實(shí)體位置信息以及實(shí)體類型信息在模型中間拼接,符合關(guān)系抽取三元組的天然結(jié)構(gòu)。