一種裁判文書結(jié)構(gòu)化處理方法及系統(tǒng)
基本信息
申請(qǐng)?zhí)?/td> | CN201910893066.0 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN110750974A | 公開(公告)日 | 2020-02-04 |
申請(qǐng)公布號(hào) | CN110750974A | 申請(qǐng)公布日 | 2020-02-04 |
分類號(hào) | G06F40/186;G06Q50/18 | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 不公告發(fā)明人 | 申請(qǐng)(專利權(quán))人 | 成都星云律例科技有限責(zé)任公司 |
代理機(jī)構(gòu) | 成都行之專利代理事務(wù)所(普通合伙) | 代理人 | 熊曦 |
地址 | 610000 四川省成都市高新區(qū)錦暉西一街99號(hào)2棟1單元19樓1909號(hào) | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種裁判文書結(jié)構(gòu)化處理方法及系統(tǒng),所述方法包括:建立裁判文書語料庫;分析裁判文書結(jié)構(gòu);標(biāo)注裁判文書,將標(biāo)注的裁判文書劃分為訓(xùn)練集和驗(yàn)證集;構(gòu)建語言模型并預(yù)訓(xùn)練;計(jì)算預(yù)訓(xùn)練語言模型的損失函數(shù);將訓(xùn)練集輸入預(yù)訓(xùn)練語言模型,輸出訓(xùn)練集中裁判文書的向量表示;利用該向量及訓(xùn)練集標(biāo)注數(shù)據(jù)訓(xùn)練預(yù)測(cè)分段模型,獲得初步的預(yù)測(cè)分段模型;將驗(yàn)證集輸入預(yù)訓(xùn)練語言模型,將輸出的向量輸入初步預(yù)測(cè)分段模型,對(duì)比輸出的分段結(jié)果與裁判文書標(biāo)注調(diào)整優(yōu)化預(yù)測(cè)分段模型,得到最優(yōu)預(yù)測(cè)分段模型;利用本發(fā)明可提升裁判文書結(jié)構(gòu)化處理準(zhǔn)確率,降低對(duì)人工核查的依賴,提升裁判文書結(jié)構(gòu)化處理效率。 |
