一種基于文字位置信息的OCR優(yōu)化方法及系統(tǒng)
基本信息
申請?zhí)?/td> | CN202011090602.2 | 申請日 | - |
公開(公告)號 | CN112308057A | 公開(公告)日 | 2021-02-02 |
申請公布號 | CN112308057A | 申請公布日 | 2021-02-02 |
分類號 | G06K9/20(2006.01)I | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 張麗麗;劉宏亮;劉偉珊;王菲 | 申請(專利權(quán))人 | 山東國贏大數(shù)據(jù)產(chǎn)業(yè)有限公司 |
代理機構(gòu) | 濟南圣達知識產(chǎn)權(quán)代理有限公司 | 代理人 | 董雪 |
地址 | 250000山東省濟南市歷下區(qū)經(jīng)十路9999號黃金時代廣場GH座群房二層201室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種基于文字位置信息的OCR優(yōu)化方法及系統(tǒng),包括:設(shè)定需要提取的約束信息項及提取范圍;對待識別圖像進行預(yù)處理,獲取所述圖像中的文字及位置信息;計算所有文字信息的平均行間距,確定當(dāng)前文字與下一行文字之間的間距,基于所述間距與平均行間距的大小,判斷當(dāng)前文字與下一行文字是否需要合并;對上述提取到的信息項文字?jǐn)?shù)據(jù)進行格式化輸出。本發(fā)明方法在保證識別結(jié)果準(zhǔn)確率的前提下,只需要對圖片掃描一次就可以實現(xiàn)對各類文字的高精度提取,可顯著降低OCR識別技術(shù)實現(xiàn)的算力硬件成本和時間成本。?? |
