司法文書的結(jié)構(gòu)化分析方法及系統(tǒng)

基本信息

申請?zhí)?/td> CN201911364829.9 申請日 -
公開(公告)號 CN111145052A 公開(公告)日 2020-05-12
申請公布號 CN111145052A 申請公布日 2020-05-12
分類號 G06Q50/18;G06F40/295;G06F16/80 分類 計算;推算;計數(shù);
發(fā)明人 陳浩 申請(專利權(quán))人 北京法意科技有限公司
代理機構(gòu) 北京方韜法業(yè)專利代理事務(wù)所(普通合伙) 代理人 黨小林
地址 100000 北京市西城區(qū)西直門北大街北濱河路9號樓第五層
法律狀態(tài) -

摘要

摘要 本發(fā)明提供了一種司法文書的結(jié)構(gòu)化分析方法及系統(tǒng)。所述方法包括:對預(yù)先構(gòu)建信息項模型中的復(fù)雜信息項,構(gòu)建關(guān)系模型,構(gòu)建專家規(guī)則庫,創(chuàng)建帶標(biāo)注的司法文書樣本集;以司法文書樣本集為輸入,以文本片的內(nèi)容特征為依據(jù),輸出文書切片模型;提取來源于各切片或已提取的信息項,基于規(guī)則與統(tǒng)計混合NLP結(jié)構(gòu)化技術(shù),構(gòu)建文書信息項模型;將文書的切片及文書信息項模型輸出為XML結(jié)構(gòu)化文檔。本發(fā)明提供的司法文書的結(jié)構(gòu)化分析方法及系統(tǒng)能夠?qū)⒔Y(jié)構(gòu)化分析方法應(yīng)用于多個不同種類的司法文書,擴大結(jié)構(gòu)化分析方法在司法文書分析領(lǐng)域的覆蓋面。