一種文本錯(cuò)誤檢測(cè)方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
基本信息
申請(qǐng)?zhí)?/td> | CN202010558705.0 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN113822052A | 公開(公告)日 | 2021-12-21 |
申請(qǐng)公布號(hào) | CN113822052A | 申請(qǐng)公布日 | 2021-12-21 |
分類號(hào) | G06F40/253(2020.01)I;G06F40/30(2020.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 余勇宏 | 申請(qǐng)(專利權(quán))人 | 上海流利說信息技術(shù)有限公司 |
代理機(jī)構(gòu) | 北京信遠(yuǎn)達(dá)知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | 范志平 |
地址 | 200090上海市楊浦區(qū)長陽路1687號(hào)西1168幢(C樓)一層C2101室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本申請(qǐng)公開了一種文本錯(cuò)誤檢測(cè)方法,所述文本錯(cuò)誤檢測(cè)方法包括獲取第一語言的訓(xùn)練文本,并確定訓(xùn)練文本的困惑度和語法錯(cuò)誤信息;將訓(xùn)練文本翻譯為第二語言的樞軸語言文本,將樞軸語言文本翻譯為第一語言的目標(biāo)文本;計(jì)算訓(xùn)練文本與目標(biāo)文本的文本相似度,并確定目標(biāo)文本的困惑度;將訓(xùn)練文本和目標(biāo)文本分別與樞軸語言文本進(jìn)行詞對(duì)齊操作,得到訓(xùn)練文本和目標(biāo)文本的對(duì)齊評(píng)價(jià)信息;訓(xùn)練初始模型得到語義不明檢測(cè)模型,通過語義不明檢測(cè)模型對(duì)待檢測(cè)語句文本執(zhí)行文本錯(cuò)誤檢測(cè)操作。本申請(qǐng)能夠檢測(cè)文本中的語義不明錯(cuò)誤,提高文本檢測(cè)的精準(zhǔn)度。本申請(qǐng)還公開了一種文本錯(cuò)誤檢測(cè)裝置、一種電子設(shè)備及一種存儲(chǔ)介質(zhì),具有以上有益效果。 |
