基于裁判文書的雙向編碼器表征量模型優(yōu)化方法和裝置

基本信息

申請?zhí)?/td> CN202011217507.4 申請日 -
公開(公告)號 CN112347738A 公開(公告)日 2021-02-09
申請公布號 CN112347738A 申請公布日 2021-02-09
分類號 G06F40/126(2020.01)I; 分類 計算;推算;計數(shù);
發(fā)明人 閻守衛(wèi) 申請(專利權(quán))人 平安直通咨詢有限公司上海分公司
代理機構(gòu) 廣州華進聯(lián)合專利商標(biāo)代理有限公司 代理人 姜曉云
地址 200040上海市靜安區(qū)常熟路8號裙房4層A室
法律狀態(tài) -

摘要

摘要 本申請涉及人工智能,提供了一種基于裁判文書的雙向編碼器表征量模型優(yōu)化方法和裝置。所述方法包括:根據(jù)初始雙向編碼器表征量模型,確定出與法律裁判文書數(shù)據(jù)對應(yīng)的初始預(yù)訓(xùn)練模型。獲取根據(jù)法律裁判文書數(shù)據(jù)確定的預(yù)設(shè)個數(shù)的案由類別,并為各案由類別添加對應(yīng)的類別標(biāo)簽?;陬悇e標(biāo)簽從法律裁判文書數(shù)據(jù)中提取出對應(yīng)的訓(xùn)練數(shù)據(jù)集,并對訓(xùn)練數(shù)據(jù)集進行數(shù)據(jù)預(yù)處理。基于預(yù)處理后的訓(xùn)練數(shù)據(jù)集,對確定出的初始預(yù)訓(xùn)練模型的特定超參數(shù)進行優(yōu)化訓(xùn)練,得到優(yōu)化后的雙向編碼器表征量模型。采用本方法實現(xiàn)了根據(jù)優(yōu)化后的雙向編碼器表征量模型對法律裁判文書的自然語言表征,提升雙向編碼器表征量模型在裁判文書所屬的法律知識領(lǐng)域的應(yīng)用效果。??