文本糾錯方法及相關(guān)設(shè)備

基本信息

申請?zhí)?/td> CN202111629155.8 申請日 -
公開(公告)號 CN114330303A 公開(公告)日 2022-04-12
申請公布號 CN114330303A 申請公布日 2022-04-12
分類號 G06F40/232(2020.01)I;G06F40/242(2020.01)I;G06F40/289(2020.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 朵思惟;余梓飛;張程華;張艷麗 申請(專利權(quán))人 天津匯智星源信息技術(shù)有限公司
代理機(jī)構(gòu) 北京風(fēng)雅頌專利代理有限公司 代理人 朱智勇
地址 300384天津市濱海新區(qū)華苑產(chǎn)業(yè)區(qū)開華道22號5號樓西塔2001-2008室
法律狀態(tài) -

摘要

摘要 本申請?zhí)峁┮环N文本糾錯方法及相關(guān)設(shè)備,包括:獲取待糾錯文本;通過分詞算法對所述待糾錯文本進(jìn)行分詞,得到分詞糾錯文本;分別對所述待糾錯文本和所述分詞糾錯文本進(jìn)行錯誤檢測,以得到錯誤候選集合,所述錯誤候選集合包括錯誤字詞;基于所述錯誤候選集合確定替換候選集合;對所述錯誤候選集合進(jìn)行分組,以得到多個錯誤候選子集合;基于多個所述錯誤候選子集合生成多個候選路徑;基于所述替換候選集合和所述候選路徑確定候選推薦集合;基于所述推薦候選集合通過預(yù)設(shè)算法得到推薦文本。本申請?zhí)峁┑奈谋炯m錯方法能夠覆蓋所有糾錯路徑和候選可能,提高文本糾錯的正確率。