一種語義錯誤檢測方法、裝置、設(shè)備及可讀存儲介質(zhì)

基本信息

申請?zhí)?/td> CN202010662255.X 申請日 -
公開(公告)號 CN113919359A 公開(公告)日 2022-01-11
申請公布號 CN113919359A 申請公布日 2022-01-11
分類號 G06F40/30(2020.01)I;G06F40/253(2020.01)I;G06F40/289(2020.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 王永杰 申請(專利權(quán))人 上海流利說信息技術(shù)有限公司
代理機(jī)構(gòu) 北京信遠(yuǎn)達(dá)知識產(chǎn)權(quán)代理有限公司 代理人 李兆軒
地址 200090上海市楊浦區(qū)長陽路1687號西1168幢(C樓)一層C2101室
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種語義錯誤檢測方法、裝置、設(shè)備及計(jì)算機(jī)可讀存儲介質(zhì),該方法包括:獲取多個初始訓(xùn)練語料,并確定各個初始訓(xùn)練語料中的目標(biāo)詞;基于目標(biāo)詞對初始訓(xùn)練語料進(jìn)行訓(xùn)練語料生成處理,得到訓(xùn)練語料集;利用訓(xùn)練語料集對初始模型進(jìn)行訓(xùn)練,得到語義錯誤檢測模型;獲取待檢測語料和待測詞信息并輸入語義錯誤檢測模型,根據(jù)待測詞信息利用語義錯誤檢測模型對待檢測語料進(jìn)行檢測,得到檢測結(jié)果;該方法采用了基于目標(biāo)詞的訓(xùn)練語料生成方法生成訓(xùn)練語料集,可以得到針對語義進(jìn)行區(qū)分的訓(xùn)練語料集,對應(yīng)的語義錯誤檢測模型可以從語義方面對待檢測語料中的待測詞使用是否正確進(jìn)行檢測,提高了對語料中語義錯誤的檢測能力。