識別文本糾錯(cuò)方法及裝置
基本信息
申請?zhí)?/td> | CN201711167434.0 | 申請日 | - |
公開(公告)號 | CN107977356B | 公開(公告)日 | 2019-10-25 |
申請公布號 | CN107977356B | 申請公布日 | 2019-10-25 |
分類號 | G06F17/27(2006.01)I; G06F17/28(2006.01)I; G10L15/26(2006.01)I; G10L15/00(2013.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 趙彬; 劉俊華; 魏思; 胡國平 | 申請(專利權(quán))人 | 新疆聲谷融創(chuàng)數(shù)字產(chǎn)業(yè)發(fā)展有限公司 |
代理機(jī)構(gòu) | 北京路浩知識產(chǎn)權(quán)代理有限公司 | 代理人 | 王瑩;吳歡燕 |
地址 | 830002 新疆維吾爾自治區(qū)烏魯木齊市沙依巴克區(qū)西北路458號科學(xué)大廈5樓529室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明提供一種識別文本糾錯(cuò)方法及裝置,屬于語言處理技術(shù)領(lǐng)域。該方法包括:確定識別文本中每一識別錯(cuò)誤的錯(cuò)誤分詞對應(yīng)的糾錯(cuò)詞;將每一糾錯(cuò)詞替換識別文本中對應(yīng)的錯(cuò)誤分詞,以得到識別文本對應(yīng)的糾錯(cuò)候選文本;確定每一糾錯(cuò)候選文本對應(yīng)的糾錯(cuò)置信度,并將糾錯(cuò)置信度大于第一預(yù)設(shè)閾值的糾錯(cuò)候選文本作為糾錯(cuò)后的識別文本。本發(fā)明通過確定每一糾錯(cuò)候選文本對應(yīng)的糾錯(cuò)置信度,并將糾錯(cuò)置信度大于第一預(yù)設(shè)閾值的糾錯(cuò)候選文本作為糾錯(cuò)后的識別文本。由于在通過語音識別得到識別文本后,可選取可信程度較高的糾錯(cuò)候選文本作為糾錯(cuò)后的識別文本,以實(shí)現(xiàn)對識別文本進(jìn)行糾錯(cuò),從而提高了后續(xù)翻譯的準(zhǔn)確性。 |
