一種基于雙重多尺度注意力機(jī)制的圖像語義分割方法

基本信息

申請(qǐng)?zhí)?/td> CN201910452050.6 申請(qǐng)日 -
公開(公告)號(hào) CN110163878A 公開(公告)日 2019-08-23
申請(qǐng)公布號(hào) CN110163878A 申請(qǐng)公布日 2019-08-23
分類號(hào) G06T7/11;G06K9/62;G06N3/04;G06N3/08 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 高科;楊雙;張弛 申請(qǐng)(專利權(quán))人 南京沛亭數(shù)字科技有限公司
代理機(jī)構(gòu) 北京金智普華知識(shí)產(chǎn)權(quán)代理有限公司 代理人 四川智盈科技有限公司
地址 610051 四川省成都市成華區(qū)迎暉路138號(hào)附1號(hào)
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種基于雙重多尺度注意力機(jī)制的圖像語義分割方法,屬于圖像語義分割領(lǐng)域。該方法包括:對(duì)訓(xùn)練圖像和測(cè)試圖像進(jìn)行預(yù)處理;構(gòu)建圖像語義分割模型;將預(yù)處理后的訓(xùn)練圖像送入圖像語義分割模型,得到預(yù)測(cè)輸出;根據(jù)預(yù)測(cè)輸出與真實(shí)值的差異計(jì)算損失函數(shù)值,并調(diào)優(yōu)模型參數(shù);待到達(dá)預(yù)定訓(xùn)練次數(shù)后,停止訓(xùn)練,并固定圖像語義分割模型參數(shù);輸入預(yù)處理后的測(cè)試圖像,利用圖像語義分割模型參數(shù)輸出測(cè)試圖像的預(yù)測(cè)圖,即為所述測(cè)試圖像對(duì)應(yīng)的圖像語義分割結(jié)果圖。本發(fā)明充分增強(qiáng)進(jìn)而有效捕捉圖像中的小目標(biāo)信息,且可以通過不同尺度下目標(biāo)周邊的上下文信息的結(jié)合,解決易混淆目標(biāo)的區(qū)分問題,進(jìn)而可以得到較好的圖像語義分割結(jié)果。