一種基于圖像描述的遙感圖像語義理解方法
基本信息
申請?zhí)?/td> | CN202111551378.7 | 申請日 | - |
公開(公告)號 | CN114220096A | 公開(公告)日 | 2022-03-22 |
申請公布號 | CN114220096A | 申請公布日 | 2022-03-22 |
分類號 | G06V20/70(2022.01)I;G06V10/42(2022.01)I;G06V10/46(2022.01)I;G06V10/82(2022.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 王俊;李玉琳;周煥來;張洋;錢孝偉;劉博文;李家偉;賈海濤 | 申請(專利權(quán))人 | 一拓通信集團股份有限公司 |
代理機構(gòu) | - | 代理人 | - |
地址 | 210000江蘇省南京市自貿(mào)區(qū)南京片區(qū)浦濱路320號科創(chuàng)一號大廈B座701室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明提出了一種基于圖像描述的遙感圖像語義理解方法。遙感圖像含有豐富的地物信息,場景復雜繁多,且數(shù)據(jù)集難以制作,因而遙感圖像的圖像描述準確性低。對于遙感圖像的分辨率高及目標尺度變化大的問題,在卷積神經(jīng)網(wǎng)絡(luò)中加入了通道注意力機制,通道注意力機制提升了局部相鄰通道之間的信息交互;針對遙感圖像數(shù)據(jù)集少的問題,通過連續(xù)詞袋CBOW模型將描述信息中的單詞轉(zhuǎn)換為向量映射到同一個向量空間,從而獲得描述信息的語義特征;由于傳統(tǒng)的RNN循環(huán)神經(jīng)網(wǎng)絡(luò)在處理長短不一的文本時存在缺陷,采用GRU作為RNN的神經(jīng)元節(jié)點,通過GRU模型進行遙感圖像內(nèi)容描述?;趫D像描述的遙感圖像語義理解方法對于遙感圖像能夠取得較好的描述效果。 |
