一種中文糾錯(cuò)方法、裝置、設(shè)備以及可讀存儲(chǔ)介質(zhì)

基本信息

申請(qǐng)?zhí)?/td> CN201911392614.8 申請(qǐng)日 -
公開(公告)號(hào) CN113128224A 公開(公告)日 2021-07-16
申請(qǐng)公布號(hào) CN113128224A 申請(qǐng)公布日 2021-07-16
分類號(hào) G06F40/295(2020.01)I;G06F16/36(2019.01)I;G06N5/04(2006.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 余宙;楊永智;王旭 申請(qǐng)(專利權(quán))人 北京阿博茨科技有限公司
代理機(jī)構(gòu) 國(guó)浩律師(南京)事務(wù)所 代理人 孟睿;孔劍凡
地址 100194北京市海淀區(qū)蘇家坨鎮(zhèn)西小營(yíng)南環(huán)10號(hào)院1幢1115號(hào)郵編
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及一種中文糾錯(cuò)方法、裝置、設(shè)備以及可讀存儲(chǔ)介質(zhì)。對(duì)原始語(yǔ)句進(jìn)行分詞;使用詞嵌入方法,將分詞后的詞語(yǔ)轉(zhuǎn)換成詞向量;Bi?LSTM_CRF錯(cuò)誤檢測(cè)模塊和GNN錯(cuò)誤檢測(cè)模塊分別根據(jù)輸入的詞向量給出輸出的詞向量;輸出的詞向量包括各分詞后詞語(yǔ)對(duì)應(yīng)的修正性推薦詞語(yǔ),以及每個(gè)修正性推薦詞語(yǔ)的評(píng)分;使用最優(yōu)修正性推薦詞語(yǔ)對(duì)原始語(yǔ)句進(jìn)行修正,獲得修正后語(yǔ)句,將修正后語(yǔ)句送入知識(shí)圖譜校驗(yàn)?zāi)K進(jìn)行校驗(yàn),如果校驗(yàn)通過(guò),則使用修正后語(yǔ)句替代原始語(yǔ)句,如果校驗(yàn)未能通過(guò),則放棄修正后語(yǔ)句。本發(fā)明擴(kuò)大了糾錯(cuò)覆蓋率,提高了糾錯(cuò)準(zhǔn)確率。