一種OCR識別結(jié)果糾錯方法及裝置

基本信息

申請?zhí)?/td> CN201911338669.0 申請日 -
公開(公告)號 CN111144391A 公開(公告)日 2020-05-12
申請公布號 CN111144391A 申請公布日 2020-05-12
分類號 G06K9/03;G06K9/34;G06F40/284 分類 計算;推算;計數(shù);
發(fā)明人 胡茜;劉寧;吳志超;王靜 申請(專利權(quán))人 北京愛醫(yī)生智慧醫(yī)療科技有限公司
代理機(jī)構(gòu) 北京路浩知識產(chǎn)權(quán)代理有限公司 代理人 陳玉婷
地址 102206 北京市昌平區(qū)科技園區(qū)生命園路9號院1號樓205室
法律狀態(tài) -

摘要

摘要 本發(fā)明實(shí)施例提供一種OCR識別結(jié)果糾錯方法及裝置。所述方法包括對待識別文字圖像執(zhí)行光學(xué)字符識別OCR和分詞處理得到待糾錯文本;對待糾錯文本執(zhí)行句法依存分析,得到依存搭配對;若依存搭配對不滿足預(yù)設(shè)的搭配條件,則根據(jù)混淆集對依存搭配對中的分詞進(jìn)行替換,直到各依存搭配對均滿足搭配條件;將更新后的待糾錯文本作為所述待識別文字圖像的糾錯結(jié)果文本,本發(fā)明實(shí)施例通過對待糾錯文本執(zhí)行句法依存分析得到的各依存搭配對,若不滿足預(yù)設(shè)的搭配條件,則采用混淆集對所述依存搭配對中的分詞進(jìn)行替換,直到滿足所述搭配條件,并將更新后的待糾錯文本作為糾錯結(jié)果文本,從而能夠更加準(zhǔn)確快速得實(shí)現(xiàn)對OCR識別文本的糾錯。