一種實(shí)現(xiàn)合同條款位置自動(dòng)識(shí)別實(shí)現(xiàn)的方法
基本信息
申請(qǐng)?zhí)?/td> | CN201910002041.7 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN109857994A | 公開(公告)日 | 2019-06-07 |
申請(qǐng)公布號(hào) | CN109857994A | 申請(qǐng)公布日 | 2019-06-07 |
分類號(hào) | G06F17/22(2006.01)I; G06F17/27(2006.01)I; G06F16/35(2019.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 尚宏金 | 申請(qǐng)(專利權(quán))人 | 深圳市找大狀法務(wù)科技有限公司 |
代理機(jī)構(gòu) | 北京聯(lián)瑞聯(lián)豐知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) | 代理人 | 張清彥 |
地址 | 518000 廣東省深圳市南山區(qū)粵海街道德賽科技大廈23層2301-2302號(hào) | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種實(shí)現(xiàn)合同條款位置自動(dòng)識(shí)別實(shí)現(xiàn)的方法,該方法包括以下步驟:收集若干某一類型合同,在這些某一類型合同中標(biāo)注出每個(gè)條款的起始結(jié)束位置;針對(duì)每個(gè)條款的每份數(shù)據(jù)進(jìn)行分詞、去停詞處理,得到詞袋模型,并記錄下該詞袋模型對(duì)應(yīng)的條款序號(hào),使用機(jī)器學(xué)習(xí)方法用詞袋模型和條款序號(hào)的組合數(shù)據(jù)進(jìn)行訓(xùn)練,得到合同中每個(gè)條款的區(qū)分模型,并保存在二進(jìn)制文件中;確認(rèn)新合同的合同類型,所述條款定位方法包括把新合同的每一個(gè)自然段使用區(qū)分模型計(jì)算每個(gè)條款的概率,得到新合同的概率矩陣,對(duì)每個(gè)條款,對(duì)應(yīng)概率矩陣中每一列,使用其對(duì)應(yīng)列的數(shù)據(jù)進(jìn)行定位起始結(jié)束位置。該發(fā)明自動(dòng)給合同涉及到的各個(gè)條款找到起始、結(jié)束位置。 |
