基于深度學(xué)習(xí)和并查集算法識(shí)別并抽取圖片的方法及裝置

基本信息

申請(qǐng)?zhí)?/td> CN202010919839.0 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN112149523B 公開(kāi)(公告)日 2021-05-28
申請(qǐng)公布號(hào) CN112149523B 申請(qǐng)公布日 2021-05-28
分類(lèi)號(hào) G06K9/00(2006.01)I;G06N3/04(2006.01)I;G06K9/34(2006.01)I;G06N3/08(2006.01)I;G06K9/62(2006.01)I 分類(lèi) -
發(fā)明人 汪敏;嚴(yán)妍;肖國(guó)泉;裴非;肖克;彭祖劍;邵羅樹(shù);劉茼;郭宇峰;杜寅辰;張博 申請(qǐng)(專(zhuān)利權(quán))人 北京開(kāi)普云信息科技有限公司
代理機(jī)構(gòu) - 代理人 -
地址 523000廣東省東莞市石龍鎮(zhèn)中山東東升路1號(hào)匯星商業(yè)中心5棟2單元1805室
法律狀態(tài) -

摘要

摘要 本發(fā)明提供基于深度學(xué)習(xí)和并查集算法的OCR識(shí)別并抽取圖片的方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì),屬于圖片處理技術(shù)領(lǐng)域。所述方法應(yīng)用于服務(wù)器,方法包括:采用深度學(xué)習(xí)算法對(duì)圖片進(jìn)行OCR處理,得到文本信息BOX;運(yùn)用并查集分類(lèi)算法對(duì)文本信息進(jìn)行抽取,得到段落分類(lèi);篩選后得到純文本段落;利用OpenCV對(duì)純文本段落做白色BOX覆蓋,得到TMP格式圖片;做像素橫縱掃描找到分割線(xiàn)并切分,抽取出最終圖片。本技術(shù)將深度學(xué)習(xí)算法與并查集分類(lèi)算法相融合,通過(guò)深度學(xué)習(xí)算法實(shí)現(xiàn)了OCR對(duì)圖片文本的高效識(shí)別,通過(guò)并查集分類(lèi)算法提高了OpenCV對(duì)圖片的精準(zhǔn)切割,大大提高了OCR識(shí)別和抽取圖像的準(zhǔn)確性和正確率。??