一種基于文字位置信息的OCR優(yōu)化方法及系統(tǒng)

基本信息

申請?zhí)?/td> CN202011090602.2 申請日 -
公開(公告)號 CN112308057A 公開(公告)日 2021-02-02
申請公布號 CN112308057A 申請公布日 2021-02-02
分類號 G06K9/20(2006.01)I 分類 計算;推算;計數(shù);
發(fā)明人 張麗麗;劉宏亮;劉偉珊;王菲 申請(專利權(quán))人 山東國贏大數(shù)據(jù)產(chǎn)業(yè)有限公司
代理機構(gòu) 濟南圣達知識產(chǎn)權(quán)代理有限公司 代理人 董雪
地址 250000山東省濟南市歷下區(qū)經(jīng)十路9999號黃金時代廣場GH座群房二層201室
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種基于文字位置信息的OCR優(yōu)化方法及系統(tǒng),包括:設(shè)定需要提取的約束信息項及提取范圍;對待識別圖像進行預(yù)處理,獲取所述圖像中的文字及位置信息;計算所有文字信息的平均行間距,確定當(dāng)前文字與下一行文字之間的間距,基于所述間距與平均行間距的大小,判斷當(dāng)前文字與下一行文字是否需要合并;對上述提取到的信息項文字?jǐn)?shù)據(jù)進行格式化輸出。本發(fā)明方法在保證識別結(jié)果準(zhǔn)確率的前提下,只需要對圖片掃描一次就可以實現(xiàn)對各類文字的高精度提取,可顯著降低OCR識別技術(shù)實現(xiàn)的算力硬件成本和時間成本。??