文本識別及模型訓(xùn)練方法、裝置、設(shè)備及存儲介質(zhì)
基本信息
申請?zhí)?/td> | CN202110464194.0 | 申請日 | - |
公開(公告)號 | CN113221879A | 公開(公告)日 | 2021-08-06 |
申請公布號 | CN113221879A | 申請公布日 | 2021-08-06 |
分類號 | G06K9/32(2006.01)I;G06K9/62(2006.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 鄔國銳;卿山;王慶慶 | 申請(專利權(quán))人 | 北京愛咔咔信息技術(shù)有限公司 |
代理機構(gòu) | 北京致科知識產(chǎn)權(quán)代理有限公司 | 代理人 | 李洪娟;魏紅雅 |
地址 | 100085北京市海淀區(qū)安寧莊路26號樓2層216 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明提供一種文本識別及模型訓(xùn)練方法、裝置、設(shè)備及存儲介質(zhì),該方法包括:獲取待識別圖像的包含空間位置信息的第一圖像特征;采用自注意力機制對所述第一圖像特征進行優(yōu)化,獲得第二圖像特征;將所述第一圖像特征和所述第二圖像特征進行融合,獲得第三圖像特征;對所述第三圖像特征進行解碼處理,獲得識別結(jié)果。本發(fā)明通過采用自注意力機制對包含空間位置信息的圖像特征進優(yōu)化,并將優(yōu)化后的圖像特征與優(yōu)化前的圖像特征融合后再進行解碼,融合特征有效保留了優(yōu)化前圖像特征的原始視覺特征并增加了空間依賴性信息,從而具有更好的表示能力,更有助于解碼階段的對齊操作,有效降低了注意力偏移問題,從而提高識別結(jié)果的準確性。 |
