一種基于機(jī)器學(xué)習(xí)算法的裁判文書標(biāo)注方法及裝置
基本信息
申請(qǐng)?zhí)?/td> | CN201810178639.7 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN108334500A | 公開(公告)日 | 2018-07-27 |
申請(qǐng)公布號(hào) | CN108334500A | 申請(qǐng)公布日 | 2018-07-27 |
分類號(hào) | G06F17/27;G06F17/30 | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 金耀輝;姜華;李慧;王永坤 | 申請(qǐng)(專利權(quán))人 | 江西思賢數(shù)據(jù)科技有限公司 |
代理機(jī)構(gòu) | 上海旭誠(chéng)知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | 鄭立 |
地址 | 330038 江西省南昌市紅谷灘區(qū)九龍大道1388號(hào)綠地國(guó)際博覽城JLH603-D03地塊2#商業(yè)辦公樓606室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種基于機(jī)器學(xué)習(xí)算法的裁判文書標(biāo)注方法及裝置。該方法包括:采集待標(biāo)注的裁判文書的文本集合;對(duì)所述文本集合中的文本進(jìn)行結(jié)構(gòu)分割;建立語(yǔ)義標(biāo)簽庫(kù);基于語(yǔ)義標(biāo)簽庫(kù)對(duì)所述待標(biāo)注的裁判文書進(jìn)行人工標(biāo)注;選取部分人工標(biāo)注的裁判文書作為標(biāo)準(zhǔn)數(shù)據(jù)集合交由機(jī)器學(xué)習(xí),訓(xùn)練和優(yōu)化初步標(biāo)注模型;選取剩余部分人工標(biāo)注的裁判文書樣本作為校驗(yàn)數(shù)據(jù)集合,用于完善所述語(yǔ)義標(biāo)簽庫(kù),并對(duì)所述初步標(biāo)注模型進(jìn)行迭代和優(yōu)化,得到成熟的裁判文書標(biāo)注模型;將目標(biāo)待標(biāo)注的裁判文書進(jìn)行結(jié)構(gòu)分割后輸入所述成熟的裁判文書標(biāo)注模型,得到標(biāo)注結(jié)果。通過本發(fā)明,解決了相關(guān)技術(shù)中裁判文書法律要素提取不完整和案件信息提取準(zhǔn)確度低的問題。 |
