一種違規(guī)圖像識(shí)別方法、系統(tǒng)及設(shè)備
基本信息
申請(qǐng)?zhí)?/td> | CN202210115379.5 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN114140673A | 公開(公告)日 | 2022-03-04 |
申請(qǐng)公布號(hào) | CN114140673A | 申請(qǐng)公布日 | 2022-03-04 |
分類號(hào) | G06V10/80(2022.01)I;G06V30/148(2022.01)I;G06V10/774(2022.01)I;G06V10/764(2022.01)I;G06F40/289(2020.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 阮曉峰;王堅(jiān);李兵;余昊楠;胡衛(wèi)明 | 申請(qǐng)(專利權(quán))人 | 人民中科(北京)智能技術(shù)有限公司 |
代理機(jī)構(gòu) | 北京三友知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | 許曼;劉飛 |
地址 | 250101山東省濟(jì)南市中國(guó)(山東)自由貿(mào)易試驗(yàn)區(qū)濟(jì)南片區(qū)經(jīng)十路7000號(hào)漢峪金谷新媒體大廈2層201室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本文涉及人工智能領(lǐng)域,提供了一種違規(guī)圖像識(shí)別方法、系統(tǒng)及設(shè)備,方法包括:分析待識(shí)別圖像,得到文本信息及圖像信息;將文本信息輸入至文本特征提取模型中,得到文本特征向量組;將圖像信息輸入至圖像特征提取模型中,得到圖像特征向量組;將文本特征向量組及圖像特征向量組輸入至特征融合模型中,得到融合特征向量組,特征融合模型用于利用交叉注意力機(jī)制使得文本特征向量為圖像特征向量添加注意力;將融合特征向量組輸入至分類識(shí)別模型中,得到違規(guī)識(shí)別結(jié)果。本文使用交叉注意力機(jī)制融合兩種模態(tài)特征,可提升違規(guī)圖像識(shí)別的性能及魯棒性。 |
