識(shí)別文本檢錯(cuò)方法及裝置

基本信息

申請(qǐng)?zhí)?/td> CN201711167410.5 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN107844481A 公開(kāi)(公告)日 2018-03-27
申請(qǐng)公布號(hào) CN107844481A 申請(qǐng)公布日 2018-03-27
分類號(hào) G06F17/28;G06F17/27 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 劉俊華;魏思;胡國(guó)平;柳林;王建社;方昕;李永超;孟廷 申請(qǐng)(專利權(quán))人 新疆聲谷融創(chuàng)數(shù)字產(chǎn)業(yè)發(fā)展有限公司
代理機(jī)構(gòu) 北京路浩知識(shí)產(chǎn)權(quán)代理有限公司 代理人 王瑩;吳歡燕
地址 830002 新疆維吾爾自治區(qū)烏魯木齊市沙依巴克區(qū)西北路458號(hào)科學(xué)大廈5樓529室
法律狀態(tài) -

摘要

摘要 本發(fā)明實(shí)施例提供一種識(shí)別文本檢錯(cuò)方法及裝置,屬于語(yǔ)言處理技術(shù)領(lǐng)域。該方法包括:獲取識(shí)別文本中每一分詞的識(shí)別置信度、翻譯置信度和語(yǔ)境置信度;將識(shí)別文本中每一分詞的識(shí)別置信度、翻譯置信度及語(yǔ)境置信度進(jìn)行融合,以得到識(shí)別文本中每一分詞的綜合置信度分值,將綜合置信度分值小于預(yù)設(shè)閾值的分詞作為識(shí)別文本中的錯(cuò)誤詞。由于可基于翻譯置信度反向確定每一分詞作為識(shí)別結(jié)果的可信程度,并可基于語(yǔ)境置信度確定每一分詞在翻譯前或翻譯后的語(yǔ)境中作為識(shí)別結(jié)果的可信程度,從而在結(jié)合翻譯置信度、語(yǔ)境置信度以及識(shí)別置信度對(duì)識(shí)別文本中每一分詞進(jìn)行檢錯(cuò)時(shí),檢錯(cuò)依據(jù)較為多元,并可提高檢錯(cuò)準(zhǔn)確度。