一種基于特征解耦合的文字-圖像對生成方法和裝置
基本信息
申請?zhí)?/td> | CN202210148651.X | 申請日 | - |
公開(公告)號 | CN114677569A | 公開(公告)日 | 2022-06-28 |
申請公布號 | CN114677569A | 申請公布日 | 2022-06-28 |
分類號 | G06V10/80(2022.01)I;G06V10/40(2022.01)I;G06V30/18(2022.01)I;G06V10/82(2022.01)I;G06K9/62(2022.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I | 分類 | 計算;推算;計數; |
發(fā)明人 | 王蕊;梁棟;李太豪;裴冠雄 | 申請(專利權)人 | 中國科學院信息工程研究所 |
代理機構 | 杭州浙科專利事務所(普通合伙) | 代理人 | - |
地址 | 311100浙江省杭州市余杭區(qū)中泰街道之江實驗室南湖總部 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開一種基于特征解耦合的文字?圖像對生成方法和裝置,該方法首先利用帶標注的文字?圖像對數據訓練編碼器,將文字和圖像兩種模態(tài)映射到同一個隱空間;然后利用無標注的圖像數據訓練圖像編碼器和解碼器,同時利用無標注的文字數據訓練文字編碼器與解碼器;利用訓練好的文字?圖像特征編碼器網絡提取文字?圖像初始特征,在隱空間加入隨機采樣的噪聲后進行解耦合,利用解碼器生成多樣化的文字?圖像對。本發(fā)明在自然場景中,例如改變紋理、顏色等高層語義屬性,都可以實現較好的文本?圖像數據編輯。 |
