OCR文檔識(shí)別方法及其裝置

基本信息

申請(qǐng)?zhí)?/td> CN201811493531.3 申請(qǐng)日 -
公開(公告)號(hào) CN109614923A 公開(公告)日 2022-06-21
申請(qǐng)公布號(hào) CN109614923A 申請(qǐng)公布日 2022-06-21
分類號(hào) G06K9/00;G06K9/32 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 張波;陳成才 申請(qǐng)(專利權(quán))人 上海智臻智能網(wǎng)絡(luò)科技股份有限公司
代理機(jī)構(gòu) 北京品源專利代理有限公司 代理人 孟金喆
地址 201803 上海市嘉定區(qū)金沙江西路1555弄398號(hào)7層
法律狀態(tài) -

摘要

摘要 本發(fā)明提供一種OCR文檔識(shí)別方法、OCR文檔識(shí)別裝置、計(jì)算機(jī)設(shè)備以及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)。所述方法包括:提供待識(shí)別的OCR文檔;判斷所述OCR文檔中是否包括表格;當(dāng)所述OCR文檔中包括表格時(shí),對(duì)所述OCR文檔進(jìn)行文字檢測(cè),并判斷檢測(cè)框中是否包括直線;當(dāng)包括直線時(shí),對(duì)所述OCR文檔進(jìn)行放大處理,直至檢測(cè)框中不包括直線;對(duì)所述放大后的OCR文檔進(jìn)行文字識(shí)別處理。由于將OCR文檔中的表格放大至合適位置,消除了表格的直線對(duì)檢測(cè)造成的影響,因此提高了文檔中表格內(nèi)的文字識(shí)別準(zhǔn)確率。