一種基于文字位置信息的OCR優(yōu)化方法及系統(tǒng)
基本信息
申請(qǐng)?zhí)?/td> | CN202011090602.2 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN112308057A | 公開(公告)日 | 2021-02-02 |
申請(qǐng)公布號(hào) | CN112308057A | 申請(qǐng)公布日 | 2021-02-02 |
分類號(hào) | G06K9/20(2006.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 張麗麗;劉宏亮;劉偉珊;王菲 | 申請(qǐng)(專利權(quán))人 | 山東國(guó)贏大數(shù)據(jù)產(chǎn)業(yè)有限公司 |
代理機(jī)構(gòu) | 濟(jì)南圣達(dá)知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | 董雪 |
地址 | 250000山東省濟(jì)南市歷下區(qū)經(jīng)十路9999號(hào)黃金時(shí)代廣場(chǎng)GH座群房二層201室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種基于文字位置信息的OCR優(yōu)化方法及系統(tǒng),包括:設(shè)定需要提取的約束信息項(xiàng)及提取范圍;對(duì)待識(shí)別圖像進(jìn)行預(yù)處理,獲取所述圖像中的文字及位置信息;計(jì)算所有文字信息的平均行間距,確定當(dāng)前文字與下一行文字之間的間距,基于所述間距與平均行間距的大小,判斷當(dāng)前文字與下一行文字是否需要合并;對(duì)上述提取到的信息項(xiàng)文字?jǐn)?shù)據(jù)進(jìn)行格式化輸出。本發(fā)明方法在保證識(shí)別結(jié)果準(zhǔn)確率的前提下,只需要對(duì)圖片掃描一次就可以實(shí)現(xiàn)對(duì)各類文字的高精度提取,可顯著降低OCR識(shí)別技術(shù)實(shí)現(xiàn)的算力硬件成本和時(shí)間成本。?? |
