一種用于端到端的文字檢測(cè)與識(shí)別的方法和裝置

基本信息

申請(qǐng)?zhí)?/td> CN202010006312.9 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN111242129A 公開(kāi)(公告)日 2020-06-05
申請(qǐng)公布號(hào) CN111242129A 申請(qǐng)公布日 2020-06-05
分類號(hào) G06K9/34(2006.01)I;G06N3/04(2006.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 連慶;宋彥;王詠剛 申請(qǐng)(專利權(quán))人 創(chuàng)新工場(chǎng)(廣州)人工智能研究有限公司
代理機(jī)構(gòu) 北京啟坤知識(shí)產(chǎn)權(quán)代理有限公司 代理人 姜冰瑩
地址 510700廣東省廣州市黃埔區(qū)光譜中路23號(hào)A2棟1001房
法律狀態(tài) -

摘要

摘要 本申請(qǐng)?zhí)峁┝艘环N用于端到端的文字檢測(cè)與識(shí)別的方法和裝置,所述方法包括:將目標(biāo)圖片輸入至特征提取網(wǎng)絡(luò),獲得所述目標(biāo)圖片對(duì)應(yīng)的共享特征信息;將所述共享特征信息輸入至文字檢測(cè)網(wǎng)絡(luò),并獲得所述文字檢測(cè)網(wǎng)絡(luò)輸出的字符檢測(cè)結(jié)果,其中,所述字符檢測(cè)結(jié)果包括字符區(qū)域檢測(cè)結(jié)果和字符連接區(qū)域檢測(cè)結(jié)果;將所述共享特征信息和所述字符檢測(cè)結(jié)果輸入至文字識(shí)別網(wǎng)絡(luò),獲得所述文字識(shí)別網(wǎng)絡(luò)輸出的文字識(shí)別結(jié)果;根據(jù)所述字符檢測(cè)結(jié)果和所述文字識(shí)別結(jié)果生成最終識(shí)別結(jié)果。根據(jù)本申請(qǐng)的方案,能夠解決現(xiàn)有注意力網(wǎng)絡(luò)可能存在的預(yù)測(cè)區(qū)域與實(shí)際區(qū)域未對(duì)準(zhǔn)的問(wèn)題,且能夠更好的將文字檢測(cè)系統(tǒng)與文字識(shí)別系統(tǒng)相融合。??