識別文本檢錯方法及裝置

基本信息

申請?zhí)?/td> CN201711167410.5 申請日 -
公開(公告)號 CN107844481B 公開(公告)日 2019-09-13
申請公布號 CN107844481B 申請公布日 2019-09-13
分類號 G06F17/28(2006.01)I; G06F17/27(2006.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 劉俊華; 魏思; 胡國平; 柳林; 王建社; 方昕; 李永超; 孟廷 申請(專利權(quán))人 新疆聲谷融創(chuàng)數(shù)字產(chǎn)業(yè)發(fā)展有限公司
代理機(jī)構(gòu) 北京路浩知識產(chǎn)權(quán)代理有限公司 代理人 王瑩;吳歡燕
地址 830002 新疆維吾爾自治區(qū)烏魯木齊市沙依巴克區(qū)西北路458號科學(xué)大廈5樓529室
法律狀態(tài) -

摘要

摘要 本發(fā)明實(shí)施例提供一種識別文本檢錯方法及裝置,屬于語言處理技術(shù)領(lǐng)域。該方法包括:獲取識別文本中每一分詞的識別置信度、翻譯置信度和語境置信度;將識別文本中每一分詞的識別置信度、翻譯置信度及語境置信度進(jìn)行融合,以得到識別文本中每一分詞的綜合置信度分值,將綜合置信度分值小于預(yù)設(shè)閾值的分詞作為識別文本中的錯誤詞。由于可基于翻譯置信度反向確定每一分詞作為識別結(jié)果的可信程度,并可基于語境置信度確定每一分詞在翻譯前或翻譯后的語境中作為識別結(jié)果的可信程度,從而在結(jié)合翻譯置信度、語境置信度以及識別置信度對識別文本中每一分詞進(jìn)行檢錯時,檢錯依據(jù)較為多元,并可提高檢錯準(zhǔn)確度。