一種手寫英文行識別系統(tǒng)
基本信息
申請?zhí)?/td> | CN202210217783.3 | 申請日 | - |
公開(公告)號 | CN114299510A | 公開(公告)日 | 2022-04-08 |
申請公布號 | CN114299510A | 申請公布日 | 2022-04-08 |
分類號 | G06V30/22(2022.01)I;G06V10/40(2022.01)I;G06V10/80(2022.01)I;G06V10/82(2022.01)I;G06V30/19(2022.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 許信順;譚玉慧;馬磊;陳義學(xué) | 申請(專利權(quán))人 | 山東山大鷗瑪軟件股份有限公司 |
代理機(jī)構(gòu) | 山東舜源聯(lián)合知識產(chǎn)權(quán)代理有限公司 | 代理人 | 馬洪磊 |
地址 | 250101山東省濟(jì)南市高新區(qū)伯樂路128號 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明提出的一種手寫英文行識別系統(tǒng),屬于文本識別技術(shù)領(lǐng)域。包括:視覺模塊、語義模塊和融合模塊;視覺模塊,用于使用ResNet網(wǎng)絡(luò)提取手寫英文行的文本圖像的空間特征,并使用基于CTC和基于Attention的模型進(jìn)行解碼,輸出字符級解碼和單詞級解碼;語義模塊,用于使用視覺模塊中輸出的基于Attention的字符級解碼的輸出概率作為輸入,通過使用梯度截?cái)嗖呗裕约m正預(yù)測序列的方式顯式學(xué)習(xí)英文行中潛在的語義信息;融合模塊,用于通過使用門機(jī)制將視覺模塊提取到的視覺信息和語義模塊提取到的語義信息進(jìn)行結(jié)合,以生成預(yù)測結(jié)果。 |
