一種基于裁判文書(shū)的結(jié)構(gòu)化處理方法

基本信息

申請(qǐng)?zhí)?/td> CN201711338564.6 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN108197163A 公開(kāi)(公告)日 2018-06-22
申請(qǐng)公布號(hào) CN108197163A 申請(qǐng)公布日 2018-06-22
分類號(hào) G06F17/30;G06K9/62 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 武敏;姚斌;王玨 申請(qǐng)(專利權(quán))人 上海銀江智慧智能化技術(shù)有限公司
代理機(jī)構(gòu) 杭州之江專利事務(wù)所(普通合伙) 代理人 張慧英
地址 200120 上海市浦東新區(qū)中國(guó)(上海)自由貿(mào)易試驗(yàn)區(qū)芳春路400號(hào)1幢3層301-611室
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及一種基于裁判文書(shū)的結(jié)構(gòu)化處理方法,本發(fā)明采用自然語(yǔ)言處理技術(shù)和高級(jí)機(jī)器學(xué)習(xí)技術(shù),自動(dòng)實(shí)現(xiàn)基于案由文本的關(guān)鍵詞提取的案件類型分類,從而通過(guò)構(gòu)建案件層次結(jié)構(gòu)和設(shè)計(jì)的提取規(guī)則進(jìn)行結(jié)構(gòu)化處理,本發(fā)明通過(guò)相關(guān)詞庫(kù)的構(gòu)建與擴(kuò)展、裁判文書(shū)模塊分割、設(shè)計(jì)確定聚簇?cái)?shù)目K、初始聚類中心以及采用詞語(yǔ)權(quán)重的增量作為第二特征選擇來(lái)實(shí)現(xiàn)kmeans聚類算法的改進(jìn),并得到案例的類標(biāo)簽;根據(jù)不同案例類型創(chuàng)建不同層次框架,結(jié)合設(shè)計(jì)的提取規(guī)則,得到裁判文書(shū)的結(jié)構(gòu)化處理。本發(fā)明可快遞實(shí)現(xiàn)裁判文書(shū)的結(jié)構(gòu)化處理。