一種OCR識別結(jié)果糾錯方法及裝置
基本信息
申請?zhí)?/td> | CN201911338669.0 | 申請日 | - |
公開(公告)號 | CN111144391A | 公開(公告)日 | 2020-05-12 |
申請公布號 | CN111144391A | 申請公布日 | 2020-05-12 |
分類號 | G06K9/03;G06K9/34;G06F40/284 | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 胡茜;劉寧;吳志超;王靜 | 申請(專利權(quán))人 | 北京愛醫(yī)生智慧醫(yī)療科技有限公司 |
代理機(jī)構(gòu) | 北京路浩知識產(chǎn)權(quán)代理有限公司 | 代理人 | 陳玉婷 |
地址 | 102206 北京市昌平區(qū)科技園區(qū)生命園路9號院1號樓205室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明實(shí)施例提供一種OCR識別結(jié)果糾錯方法及裝置。所述方法包括對待識別文字圖像執(zhí)行光學(xué)字符識別OCR和分詞處理得到待糾錯文本;對待糾錯文本執(zhí)行句法依存分析,得到依存搭配對;若依存搭配對不滿足預(yù)設(shè)的搭配條件,則根據(jù)混淆集對依存搭配對中的分詞進(jìn)行替換,直到各依存搭配對均滿足搭配條件;將更新后的待糾錯文本作為所述待識別文字圖像的糾錯結(jié)果文本,本發(fā)明實(shí)施例通過對待糾錯文本執(zhí)行句法依存分析得到的各依存搭配對,若不滿足預(yù)設(shè)的搭配條件,則采用混淆集對所述依存搭配對中的分詞進(jìn)行替換,直到滿足所述搭配條件,并將更新后的待糾錯文本作為糾錯結(jié)果文本,從而能夠更加準(zhǔn)確快速得實(shí)現(xiàn)對OCR識別文本的糾錯。 |
