基于深度神經(jīng)網(wǎng)絡(luò)的光學(xué)字符識(shí)別方法及裝置
基本信息
申請(qǐng)?zhí)?/td> | CN202110396340.0 | 申請(qǐng)日 | - |
公開(kāi)(公告)號(hào) | CN113095315A | 公開(kāi)(公告)日 | 2021-07-09 |
申請(qǐng)公布號(hào) | CN113095315A | 申請(qǐng)公布日 | 2021-07-09 |
分類號(hào) | G06K9/20(2006.01)I;G06K9/46(2006.01)I;G06K9/38(2006.01)I;G06K9/62(2006.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 劉有亮;葉雨桐 | 申請(qǐng)(專利權(quán))人 | 第六鏡科技(成都)有限公司 |
代理機(jī)構(gòu) | 北京欣鼎專利代理事務(wù)所(普通合伙) | 代理人 | 王陽(yáng)虹 |
地址 | 610000四川省成都市高新區(qū)吉泰五路88號(hào)3棟26層3號(hào) | ||
法律狀態(tài) | - |
摘要
摘要 | 本申請(qǐng)公開(kāi)了一種基于深度神經(jīng)網(wǎng)絡(luò)的光學(xué)字符識(shí)別方法及裝置。該方法包括:確定待識(shí)別的第一圖像;將所述第一圖像輸入至第一神經(jīng)網(wǎng)絡(luò),得到文本檢測(cè)框,所述文本檢測(cè)框中包括至少一個(gè)文字;提取所述文本檢測(cè)框中的文字,以及基于提取出的文字,得到文本圖像;調(diào)整所述文本圖像的尺寸,以及將調(diào)整后的文本圖像輸入至第二神經(jīng)網(wǎng)絡(luò),得到所述文本圖像中文字的識(shí)別結(jié)果。由此,提升了識(shí)別的準(zhǔn)確性,且實(shí)現(xiàn)了在移動(dòng)端的應(yīng)用與部署。 |
