一種基于文字表述的行人檢索方法

基本信息

申請(qǐng)?zhí)?/td> CN202110311957.8 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN113157974A 公開(kāi)(公告)日 2021-07-23
申請(qǐng)公布號(hào) CN113157974A 申請(qǐng)公布日 2021-07-23
分類號(hào) G06F16/75;G06F16/783;G06K9/00;G06K9/62;G06N3/04;G06N3/08 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 朱繼;楊少毅;褚智威;石光明;李甫;牛毅 申請(qǐng)(專利權(quán))人 西安維塑智能科技有限公司
代理機(jī)構(gòu) 西安智萃知識(shí)產(chǎn)權(quán)代理有限公司 代理人 王暢陽(yáng)
地址 710018 陜西省西安市鳳城十路99號(hào)
法律狀態(tài) -

摘要

摘要 本發(fā)明提出一種基于文字表述的行人檢索方法,包括步驟1:在全局神經(jīng)網(wǎng)絡(luò)分支中,提取圖像和文字的全局特征;步驟2:在細(xì)粒度神經(jīng)網(wǎng)絡(luò)分支中,通過(guò)引入關(guān)注度機(jī)制的神經(jīng)網(wǎng)絡(luò),提取圖像和文字相互對(duì)應(yīng)的細(xì)粒度特征;步驟3:在粗粒度神經(jīng)網(wǎng)絡(luò)分支中,將步驟2中提取的細(xì)粒度圖像和文字特征分別輸入到圖卷積神經(jīng)網(wǎng)絡(luò)中,將人體結(jié)構(gòu)的先驗(yàn)信息嵌入到所提取的特征中;步驟4:分別計(jì)算步驟1?3所述三個(gè)神經(jīng)網(wǎng)絡(luò)分支相對(duì)應(yīng)的圖像和文字特征的余弦相似度并求和,作為圖像和文字的最終相似度;步驟5:比較文字表述和行人圖像庫(kù)中每張行人圖像的余弦相似度,選取相似度最高的行人圖像作為行人檢索的匹配結(jié)果;本方法提高了行人檢索的準(zhǔn)確率和魯棒性。