一種基于Transformer的細(xì)粒度圖像分類方法

基本信息

申請(qǐng)?zhí)?/td> CN202210305985.3 申請(qǐng)日 -
公開(公告)號(hào) CN114676776A 公開(公告)日 2022-06-28
申請(qǐng)公布號(hào) CN114676776A 申請(qǐng)公布日 2022-06-28
分類號(hào) G06K9/62(2022.01)I;G06V10/764(2022.01)I;G06V10/80(2022.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 汲如意;李佳盈;張立波;武延軍 申請(qǐng)(專利權(quán))人 中國(guó)科學(xué)院軟件研究所
代理機(jī)構(gòu) 北京君尚知識(shí)產(chǎn)權(quán)代理有限公司 代理人 -
地址 100190北京市海淀區(qū)中關(guān)村南四街4號(hào)
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種基于Transformer的細(xì)粒度圖像分類方法。本方法為:1)將樣本圖像輸入線性映射和編碼器層中提取多層令牌特征;2)通過(guò)令牌特征選擇模塊作用于編碼器提取的多層令牌特征;3)通過(guò)語(yǔ)義部件生成模塊作用于第一層令牌特征,獲取包含辨識(shí)性視覺圖案的局部區(qū)域,利用局部分支學(xué)習(xí)該區(qū)域內(nèi)對(duì)象的細(xì)節(jié)信息;4)將兩個(gè)分支的分類令牌交換,編碼器作用于交換后的分類令牌與當(dāng)前分支的圖像塊令牌,融合全局分支提取的圖像完整信息與局部分支獲取的關(guān)鍵區(qū)域的細(xì)節(jié)信息;5)通過(guò)中心損失函數(shù)約束細(xì)粒度對(duì)象類內(nèi)特征距離,間接地增大類間特征距離;6)連接兩個(gè)分支的分類令牌,輸入到分類器,從而實(shí)現(xiàn)對(duì)輸入圖像的分類。