一種基于深度神經(jīng)網(wǎng)絡(luò)的智能視覺問答方法

基本信息

申請(qǐng)?zhí)?/td> CN201711494024.7 申請(qǐng)日 -
公開(公告)號(hào) CN108170816B 公開(公告)日 2018-06-15
申請(qǐng)公布號(hào) CN108170816B 申請(qǐng)公布日 2018-06-15
分類號(hào) G06F16/332(2019.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 紀(jì)榮嶸;周奕毅 申請(qǐng)(專利權(quán))人 廈門大學(xué)資產(chǎn)經(jīng)營有限公司
代理機(jī)構(gòu) 廈門南強(qiáng)之路專利事務(wù)所(普通合伙) 代理人 馬應(yīng)森
地址 361000 福建省廈門市思明區(qū)廈門大學(xué)大南2號(hào)樓
法律狀態(tài) -

摘要

摘要 一種基于深度神經(jīng)網(wǎng)絡(luò)的智能視覺問答模型,涉及人工智能領(lǐng)域中的智能視覺問答。包括以下步驟:智能問答數(shù)據(jù)預(yù)處理;圖像深度卷積特征抽?。晃谋締栴}深度特征抽??;智能視覺問題處理;基于樞紐通道的視覺智能問答。采用多任務(wù)學(xué)習(xí)框架進(jìn)行全新的深度學(xué)習(xí)網(wǎng)絡(luò)設(shè)計(jì)以解決智能視覺問答中訓(xùn)練數(shù)據(jù)缺乏與回答原因不可知等兩大問題。設(shè)計(jì)了一新型的深度學(xué)習(xí)網(wǎng)絡(luò)結(jié)構(gòu),該網(wǎng)絡(luò)在進(jìn)行智能視覺問答的同時(shí)能夠?qū)o出的答案進(jìn)行原因說明,該網(wǎng)絡(luò)結(jié)構(gòu)包含一視覺描述模塊,可根據(jù)問題內(nèi)容針對(duì)性地對(duì)圖像內(nèi)容進(jìn)行描述。該網(wǎng)絡(luò)結(jié)構(gòu)采用了樞紐結(jié)構(gòu)設(shè)計(jì),能將圖像描述、文本問答等領(lǐng)域的數(shù)據(jù)引入到視覺智能問答任務(wù)中來。??