一種文本錯(cuò)誤檢測(cè)方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)

基本信息

申請(qǐng)?zhí)?/td> CN202010558705.0 申請(qǐng)日 -
公開(公告)號(hào) CN113822052A 公開(公告)日 2021-12-21
申請(qǐng)公布號(hào) CN113822052A 申請(qǐng)公布日 2021-12-21
分類號(hào) G06F40/253(2020.01)I;G06F40/30(2020.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 余勇宏 申請(qǐng)(專利權(quán))人 上海流利說信息技術(shù)有限公司
代理機(jī)構(gòu) 北京信遠(yuǎn)達(dá)知識(shí)產(chǎn)權(quán)代理有限公司 代理人 范志平
地址 200090上海市楊浦區(qū)長陽路1687號(hào)西1168幢(C樓)一層C2101室
法律狀態(tài) -

摘要

摘要 本申請(qǐng)公開了一種文本錯(cuò)誤檢測(cè)方法,所述文本錯(cuò)誤檢測(cè)方法包括獲取第一語言的訓(xùn)練文本,并確定訓(xùn)練文本的困惑度和語法錯(cuò)誤信息;將訓(xùn)練文本翻譯為第二語言的樞軸語言文本,將樞軸語言文本翻譯為第一語言的目標(biāo)文本;計(jì)算訓(xùn)練文本與目標(biāo)文本的文本相似度,并確定目標(biāo)文本的困惑度;將訓(xùn)練文本和目標(biāo)文本分別與樞軸語言文本進(jìn)行詞對(duì)齊操作,得到訓(xùn)練文本和目標(biāo)文本的對(duì)齊評(píng)價(jià)信息;訓(xùn)練初始模型得到語義不明檢測(cè)模型,通過語義不明檢測(cè)模型對(duì)待檢測(cè)語句文本執(zhí)行文本錯(cuò)誤檢測(cè)操作。本申請(qǐng)能夠檢測(cè)文本中的語義不明錯(cuò)誤,提高文本檢測(cè)的精準(zhǔn)度。本申請(qǐng)還公開了一種文本錯(cuò)誤檢測(cè)裝置、一種電子設(shè)備及一種存儲(chǔ)介質(zhì),具有以上有益效果。