一種基于文字表述的行人檢索方法
基本信息
申請(qǐng)?zhí)?/td> | CN202110311957.8 | 申請(qǐng)日 | - |
公開(kāi)(公告)號(hào) | CN113157974A | 公開(kāi)(公告)日 | 2021-07-23 |
申請(qǐng)公布號(hào) | CN113157974A | 申請(qǐng)公布日 | 2021-07-23 |
分類號(hào) | G06F16/75;G06F16/783;G06K9/00;G06K9/62;G06N3/04;G06N3/08 | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 朱繼;楊少毅;褚智威;石光明;李甫;牛毅 | 申請(qǐng)(專利權(quán))人 | 西安維塑智能科技有限公司 |
代理機(jī)構(gòu) | 西安智萃知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | 王暢陽(yáng) |
地址 | 710018 陜西省西安市鳳城十路99號(hào) | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明提出一種基于文字表述的行人檢索方法,包括步驟1:在全局神經(jīng)網(wǎng)絡(luò)分支中,提取圖像和文字的全局特征;步驟2:在細(xì)粒度神經(jīng)網(wǎng)絡(luò)分支中,通過(guò)引入關(guān)注度機(jī)制的神經(jīng)網(wǎng)絡(luò),提取圖像和文字相互對(duì)應(yīng)的細(xì)粒度特征;步驟3:在粗粒度神經(jīng)網(wǎng)絡(luò)分支中,將步驟2中提取的細(xì)粒度圖像和文字特征分別輸入到圖卷積神經(jīng)網(wǎng)絡(luò)中,將人體結(jié)構(gòu)的先驗(yàn)信息嵌入到所提取的特征中;步驟4:分別計(jì)算步驟1?3所述三個(gè)神經(jīng)網(wǎng)絡(luò)分支相對(duì)應(yīng)的圖像和文字特征的余弦相似度并求和,作為圖像和文字的最終相似度;步驟5:比較文字表述和行人圖像庫(kù)中每張行人圖像的余弦相似度,選取相似度最高的行人圖像作為行人檢索的匹配結(jié)果;本方法提高了行人檢索的準(zhǔn)確率和魯棒性。 |
