一種手寫英文行識別系統(tǒng)

基本信息

申請?zhí)?/td> CN202210217783.3 申請日 -
公開(公告)號 CN114299510A 公開(公告)日 2022-04-08
申請公布號 CN114299510A 申請公布日 2022-04-08
分類號 G06V30/22(2022.01)I;G06V10/40(2022.01)I;G06V10/80(2022.01)I;G06V10/82(2022.01)I;G06V30/19(2022.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 許信順;譚玉慧;馬磊;陳義學(xué) 申請(專利權(quán))人 山東山大鷗瑪軟件股份有限公司
代理機(jī)構(gòu) 山東舜源聯(lián)合知識產(chǎn)權(quán)代理有限公司 代理人 馬洪磊
地址 250101山東省濟(jì)南市高新區(qū)伯樂路128號
法律狀態(tài) -

摘要

摘要 本發(fā)明提出的一種手寫英文行識別系統(tǒng),屬于文本識別技術(shù)領(lǐng)域。包括:視覺模塊、語義模塊和融合模塊;視覺模塊,用于使用ResNet網(wǎng)絡(luò)提取手寫英文行的文本圖像的空間特征,并使用基于CTC和基于Attention的模型進(jìn)行解碼,輸出字符級解碼和單詞級解碼;語義模塊,用于使用視覺模塊中輸出的基于Attention的字符級解碼的輸出概率作為輸入,通過使用梯度截?cái)嗖呗裕约m正預(yù)測序列的方式顯式學(xué)習(xí)英文行中潛在的語義信息;融合模塊,用于通過使用門機(jī)制將視覺模塊提取到的視覺信息和語義模塊提取到的語義信息進(jìn)行結(jié)合,以生成預(yù)測結(jié)果。