基于深度神經(jīng)網(wǎng)絡(luò)的光學(xué)字符識(shí)別方法及裝置

基本信息

申請(qǐng)?zhí)?/td> CN202110396340.0 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN113095315A 公開(kāi)(公告)日 2021-07-09
申請(qǐng)公布號(hào) CN113095315A 申請(qǐng)公布日 2021-07-09
分類號(hào) G06K9/20(2006.01)I;G06K9/46(2006.01)I;G06K9/38(2006.01)I;G06K9/62(2006.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 劉有亮;葉雨桐 申請(qǐng)(專利權(quán))人 第六鏡科技(成都)有限公司
代理機(jī)構(gòu) 北京欣鼎專利代理事務(wù)所(普通合伙) 代理人 王陽(yáng)虹
地址 610000四川省成都市高新區(qū)吉泰五路88號(hào)3棟26層3號(hào)
法律狀態(tài) -

摘要

摘要 本申請(qǐng)公開(kāi)了一種基于深度神經(jīng)網(wǎng)絡(luò)的光學(xué)字符識(shí)別方法及裝置。該方法包括:確定待識(shí)別的第一圖像;將所述第一圖像輸入至第一神經(jīng)網(wǎng)絡(luò),得到文本檢測(cè)框,所述文本檢測(cè)框中包括至少一個(gè)文字;提取所述文本檢測(cè)框中的文字,以及基于提取出的文字,得到文本圖像;調(diào)整所述文本圖像的尺寸,以及將調(diào)整后的文本圖像輸入至第二神經(jīng)網(wǎng)絡(luò),得到所述文本圖像中文字的識(shí)別結(jié)果。由此,提升了識(shí)別的準(zhǔn)確性,且實(shí)現(xiàn)了在移動(dòng)端的應(yīng)用與部署。