無人機航拍視頻內(nèi)容識別方法、裝置及系統(tǒng)

基本信息

申請?zhí)?/td> CN202010946775.3 申請日 -
公開(公告)號 CN112183236A 公開(公告)日 2021-01-05
申請公布號 CN112183236A 申請公布日 2021-01-05
分類號 G06K9/00;G06K9/62;G06N3/04;G06N3/08 分類 計算;推算;計數(shù);
發(fā)明人 吳曉琳;杜永紅;張凱;夏林元;楊嘉賀 申請(專利權(quán))人 佛山聚卓科技有限公司
代理機構(gòu) 廣州三環(huán)專利商標代理有限公司 代理人 胡楓;曹萬菊
地址 528000 廣東省佛山市南海區(qū)桂城街道大圩社區(qū)永安北路2號金谷智創(chuàng)產(chǎn)業(yè)社區(qū)A座第三層314單位(住所申報)
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種基于深度學習的無人機航拍視頻內(nèi)容識別方法,包括:實時獲取無人機拍攝的視頻圖像;對視頻圖像進行抽幀處理以提取樣本圖像,對樣本圖像進行預處理;對樣本圖像中的待識別物體進行標注,生成物體類別數(shù)據(jù)庫;利用數(shù)據(jù)增強技術(shù)擴充物體類別數(shù)據(jù)庫;利用擴充后的物體類別數(shù)據(jù)庫訓練深度神經(jīng)網(wǎng)絡模型,深度神經(jīng)網(wǎng)絡模型為SSD網(wǎng)絡模型,SSD網(wǎng)絡模型包括多分支卷積結(jié)構(gòu)及多尺度特征圖融合結(jié)構(gòu);使用訓練好的深度神經(jīng)網(wǎng)絡模型識別視頻圖像,以輸出每個物體類別的位置信息與尺寸信息。本發(fā)明還公開了一種基于深度學習的無人機航拍視頻內(nèi)容識別裝置及系統(tǒng)。采用本發(fā)明可有效解決航拍視頻物體檢測中存在的類別識別和位置定位相互影響的問題。