大分辨率圖像的目標(biāo)檢測(cè)和識(shí)別方法及裝置
基本信息
申請(qǐng)?zhí)?/td> | CN202210255384.6 | 申請(qǐng)日 | - |
公開(kāi)(公告)號(hào) | CN114332456A | 公開(kāi)(公告)日 | 2022-04-12 |
申請(qǐng)公布號(hào) | CN114332456A | 申請(qǐng)公布日 | 2022-04-12 |
分類號(hào) | G06V10/25(2022.01)I;G06V10/26(2022.01)I;G06V10/774(2022.01)I;G06V10/82(2022.01)I;G06K9/62(2022.01)I;G06N3/04(2006.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 張凱;馬樂(lè)樂(lè);崔超然;逯天斌 | 申請(qǐng)(專利權(quán))人 | 山東力聚機(jī)器人科技股份有限公司 |
代理機(jī)構(gòu) | 北京中和立達(dá)知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | 孟姣 |
地址 | 276808山東省日照市嵐山區(qū)安東衛(wèi)街道玉泉二路99號(hào)(嵐山區(qū)科技孵化器電商創(chuàng)業(yè)園) | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明涉及圖像識(shí)別技術(shù)領(lǐng)域,是關(guān)于一種大分辨率圖像的目標(biāo)檢測(cè)和識(shí)別方法及裝置,方法包括:獲取大分辨率圖像集,進(jìn)行數(shù)據(jù)增強(qiáng),得到增強(qiáng)后的圖像集;對(duì)增強(qiáng)后的圖像集中的每個(gè)原始圖像進(jìn)行分割,得到對(duì)應(yīng)的子圖像及其位置信息;對(duì)子圖像及其位置信息進(jìn)行編碼和融合處理,以得到對(duì)應(yīng)的數(shù)據(jù)張量;基于Faster R?CNN模型,對(duì)數(shù)據(jù)張量進(jìn)行逐層特征表示學(xué)習(xí),采用注意力機(jī)制對(duì)Faster R?CNN模型的低層信息、中層信息和高層信息進(jìn)行融合,確定子圖像對(duì)應(yīng)的特征表示,進(jìn)而確定候選目標(biāo)位置,進(jìn)行回歸和分類,以確定最終目標(biāo)位置及其所屬的類別;根據(jù)最終目標(biāo)位置及其所屬的類別確定原始圖像的最終目標(biāo)位置及其所屬的類別。通過(guò)該方案,提升了最終的模型性能。 |
