文本識別及模型訓(xùn)練方法、裝置、設(shè)備及存儲介質(zhì)

基本信息

申請?zhí)?/td> CN202110464194.0 申請日 -
公開(公告)號 CN113221879A 公開(公告)日 2021-08-06
申請公布號 CN113221879A 申請公布日 2021-08-06
分類號 G06K9/32(2006.01)I;G06K9/62(2006.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I 分類 計算;推算;計數(shù);
發(fā)明人 鄔國銳;卿山;王慶慶 申請(專利權(quán))人 北京愛咔咔信息技術(shù)有限公司
代理機構(gòu) 北京致科知識產(chǎn)權(quán)代理有限公司 代理人 李洪娟;魏紅雅
地址 100085北京市海淀區(qū)安寧莊路26號樓2層216
法律狀態(tài) -

摘要

摘要 本發(fā)明提供一種文本識別及模型訓(xùn)練方法、裝置、設(shè)備及存儲介質(zhì),該方法包括:獲取待識別圖像的包含空間位置信息的第一圖像特征;采用自注意力機制對所述第一圖像特征進行優(yōu)化,獲得第二圖像特征;將所述第一圖像特征和所述第二圖像特征進行融合,獲得第三圖像特征;對所述第三圖像特征進行解碼處理,獲得識別結(jié)果。本發(fā)明通過采用自注意力機制對包含空間位置信息的圖像特征進優(yōu)化,并將優(yōu)化后的圖像特征與優(yōu)化前的圖像特征融合后再進行解碼,融合特征有效保留了優(yōu)化前圖像特征的原始視覺特征并增加了空間依賴性信息,從而具有更好的表示能力,更有助于解碼階段的對齊操作,有效降低了注意力偏移問題,從而提高識別結(jié)果的準確性。