标签:VQGAN

用ViT取代Encoder!VIM:使用 ViT 改进的 VQGAN 进行矢量量化图像生成(ICLR 2022)

本文深入探讨了一种新的图像生成模型——ViT-VQGAN,它是对传统VQGAN模型的改进,通过将图像Encoder替换为Vision Transformer(ViT),在矢量量化图像建模任务...