一種文本糾錯方法和裝置

基本信息

申請?zhí)?/td> CN202011261361.3 申請日 -
公開(公告)號 CN112464650A 公開(公告)日 2021-03-09
申請公布號 CN112464650A 申請公布日 2021-03-09
分類號 G06F40/232(2020.01)I;G06F40/216(2020.01)I 分類 計算;推算;計數(shù);
發(fā)明人 吳高升;李晶;尹大胐;王詠剛 申請(專利權(quán))人 創(chuàng)新工場(北京)企業(yè)管理股份有限公司
代理機構(gòu) 北京啟坤知識產(chǎn)權(quán)代理有限公司 代理人 李琛
地址 100080北京市海淀區(qū)海淀大街3號2幢11樓
法律狀態(tài) -

摘要

摘要 本發(fā)明的目的是提供一種文本糾錯方法和裝置。所述方法包括以下步驟:基于輸入文本,生成輸入至待訓(xùn)練模型的錯誤文本;基于所述錯誤文本進行預(yù)訓(xùn)練和微調(diào),從而對所述待訓(xùn)練模型進行文本錯誤位置檢測的訓(xùn)練;基于所述錯誤文本進行遮罩訓(xùn)練,從而對所述待訓(xùn)練模型進行文本錯誤糾正的訓(xùn)練。本申請實施例具有以下優(yōu)點:通過進行檢測錯誤位置和糾正錯誤位置的訓(xùn)練,能夠定位錯誤位置并準(zhǔn)確地進行糾錯;通過在進行文本錯誤位置檢測的訓(xùn)練中進行預(yù)訓(xùn)練和微調(diào),提升了模型的泛化能力,降低了漏檢率,使得最終訓(xùn)練出來的模型具有較好的魯棒性。??