多維度混合OCR識(shí)別方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
基本信息
申請(qǐng)?zhí)?/td> | CN202111084304.7 | 申請(qǐng)日 | - |
公開(kāi)(公告)號(hào) | CN113537201A | 公開(kāi)(公告)日 | 2021-10-22 |
申請(qǐng)公布號(hào) | CN113537201A | 申請(qǐng)公布日 | 2021-10-22 |
分類號(hào) | G06K9/20(2006.01)I;G06K9/32(2006.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 馬百泉 | 申請(qǐng)(專利權(quán))人 | 江西風(fēng)向標(biāo)智能科技有限公司 |
代理機(jī)構(gòu) | 深圳市優(yōu)賽諾知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) | 代理人 | 劉斌強(qiáng) |
地址 | 330013江西省南昌市南昌經(jīng)濟(jì)技術(shù)開(kāi)發(fā)區(qū)麥園路1棟 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明提供了一種多維度混合OCR識(shí)別方法、裝置、設(shè)備及存儲(chǔ)介質(zhì),該方法包括:將圖像設(shè)置為預(yù)設(shè)尺寸;根據(jù)預(yù)設(shè)神經(jīng)網(wǎng)絡(luò)模型區(qū)分所述圖像的公式、圖表和/或文字區(qū)域,并分別獲取所述公式、圖表和/或文字區(qū)域的位置坐標(biāo);根據(jù)所述公式、圖表和/或文字區(qū)域分別調(diào)用不同的OCR模型進(jìn)行識(shí)別,以獲取識(shí)別結(jié)果;根據(jù)所述位置坐標(biāo)和識(shí)別結(jié)果輸出所述圖像的識(shí)別信息。通過(guò)上述方案,實(shí)現(xiàn)了公式、圖表及文字混合圖像的直接OCR識(shí)別,提高了識(shí)別的準(zhǔn)確度,具有較強(qiáng)的魯棒性,解決了現(xiàn)有技術(shù)中存在的難以進(jìn)行簡(jiǎn)便、準(zhǔn)確的公式、圖表及文字混合的圖像的識(shí)別的問(wèn)題。 |
