一種文本糾錯方法和裝置
基本信息
申請?zhí)?/td> | CN202011261361.3 | 申請日 | - |
公開(公告)號 | CN112464650A | 公開(公告)日 | 2021-03-09 |
申請公布號 | CN112464650A | 申請公布日 | 2021-03-09 |
分類號 | G06F40/232(2020.01)I;G06F40/216(2020.01)I | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 吳高升;李晶;尹大胐;王詠剛 | 申請(專利權(quán))人 | 創(chuàng)新工場(北京)企業(yè)管理股份有限公司 |
代理機構(gòu) | 北京啟坤知識產(chǎn)權(quán)代理有限公司 | 代理人 | 李琛 |
地址 | 100080北京市海淀區(qū)海淀大街3號2幢11樓 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明的目的是提供一種文本糾錯方法和裝置。所述方法包括以下步驟:基于輸入文本,生成輸入至待訓(xùn)練模型的錯誤文本;基于所述錯誤文本進行預(yù)訓(xùn)練和微調(diào),從而對所述待訓(xùn)練模型進行文本錯誤位置檢測的訓(xùn)練;基于所述錯誤文本進行遮罩訓(xùn)練,從而對所述待訓(xùn)練模型進行文本錯誤糾正的訓(xùn)練。本申請實施例具有以下優(yōu)點:通過進行檢測錯誤位置和糾正錯誤位置的訓(xùn)練,能夠定位錯誤位置并準(zhǔn)確地進行糾錯;通過在進行文本錯誤位置檢測的訓(xùn)練中進行預(yù)訓(xùn)練和微調(diào),提升了模型的泛化能力,降低了漏檢率,使得最終訓(xùn)練出來的模型具有較好的魯棒性。?? |
