一種用于端到端的文字檢測(cè)與識(shí)別的方法和裝置
基本信息
申請(qǐng)?zhí)?/td> | CN202010006312.9 | 申請(qǐng)日 | - |
公開(kāi)(公告)號(hào) | CN111242129A | 公開(kāi)(公告)日 | 2020-06-05 |
申請(qǐng)公布號(hào) | CN111242129A | 申請(qǐng)公布日 | 2020-06-05 |
分類號(hào) | G06K9/34(2006.01)I;G06N3/04(2006.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 連慶;宋彥;王詠剛 | 申請(qǐng)(專利權(quán))人 | 創(chuàng)新工場(chǎng)(廣州)人工智能研究有限公司 |
代理機(jī)構(gòu) | 北京啟坤知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | 姜冰瑩 |
地址 | 510700廣東省廣州市黃埔區(qū)光譜中路23號(hào)A2棟1001房 | ||
法律狀態(tài) | - |
摘要
摘要 | 本申請(qǐng)?zhí)峁┝艘环N用于端到端的文字檢測(cè)與識(shí)別的方法和裝置,所述方法包括:將目標(biāo)圖片輸入至特征提取網(wǎng)絡(luò),獲得所述目標(biāo)圖片對(duì)應(yīng)的共享特征信息;將所述共享特征信息輸入至文字檢測(cè)網(wǎng)絡(luò),并獲得所述文字檢測(cè)網(wǎng)絡(luò)輸出的字符檢測(cè)結(jié)果,其中,所述字符檢測(cè)結(jié)果包括字符區(qū)域檢測(cè)結(jié)果和字符連接區(qū)域檢測(cè)結(jié)果;將所述共享特征信息和所述字符檢測(cè)結(jié)果輸入至文字識(shí)別網(wǎng)絡(luò),獲得所述文字識(shí)別網(wǎng)絡(luò)輸出的文字識(shí)別結(jié)果;根據(jù)所述字符檢測(cè)結(jié)果和所述文字識(shí)別結(jié)果生成最終識(shí)別結(jié)果。根據(jù)本申請(qǐng)的方案,能夠解決現(xiàn)有注意力網(wǎng)絡(luò)可能存在的預(yù)測(cè)區(qū)域與實(shí)際區(qū)域未對(duì)準(zhǔn)的問(wèn)題,且能夠更好的將文字檢測(cè)系統(tǒng)與文字識(shí)別系統(tǒng)相融合。?? |
