基于裁判文書的雙向編碼器表征量模型優(yōu)化方法和裝置
基本信息
申請?zhí)?/td> | CN202011217507.4 | 申請日 | - |
公開(公告)號 | CN112347738A | 公開(公告)日 | 2021-02-09 |
申請公布號 | CN112347738A | 申請公布日 | 2021-02-09 |
分類號 | G06F40/126(2020.01)I; | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 閻守衛(wèi) | 申請(專利權(quán))人 | 平安直通咨詢有限公司上海分公司 |
代理機構(gòu) | 廣州華進聯(lián)合專利商標(biāo)代理有限公司 | 代理人 | 姜曉云 |
地址 | 200040上海市靜安區(qū)常熟路8號裙房4層A室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本申請涉及人工智能,提供了一種基于裁判文書的雙向編碼器表征量模型優(yōu)化方法和裝置。所述方法包括:根據(jù)初始雙向編碼器表征量模型,確定出與法律裁判文書數(shù)據(jù)對應(yīng)的初始預(yù)訓(xùn)練模型。獲取根據(jù)法律裁判文書數(shù)據(jù)確定的預(yù)設(shè)個數(shù)的案由類別,并為各案由類別添加對應(yīng)的類別標(biāo)簽?;陬悇e標(biāo)簽從法律裁判文書數(shù)據(jù)中提取出對應(yīng)的訓(xùn)練數(shù)據(jù)集,并對訓(xùn)練數(shù)據(jù)集進行數(shù)據(jù)預(yù)處理。基于預(yù)處理后的訓(xùn)練數(shù)據(jù)集,對確定出的初始預(yù)訓(xùn)練模型的特定超參數(shù)進行優(yōu)化訓(xùn)練,得到優(yōu)化后的雙向編碼器表征量模型。采用本方法實現(xiàn)了根據(jù)優(yōu)化后的雙向編碼器表征量模型對法律裁判文書的自然語言表征,提升雙向編碼器表征量模型在裁判文書所屬的法律知識領(lǐng)域的應(yīng)用效果。?? |
