标签:无监督学习

用ViT取代Encoder!VIM:使用 ViT 改进的 VQGAN 进行矢量量化图像生成(ICLR 2022)

本文深入探讨了一种新的图像生成模型——ViT-VQGAN,它是对传统VQGAN模型的改进,通过将图像Encoder替换为Vision Transformer(ViT),在矢量量化图像建模任务...

CVPR24|MASA开源:刷新监督学习SOTA,无监督多目标跟踪时代来临!

摘要:本文介绍了一种名为MASA(Matching Anything by Segmenting Anything)的多目标跟踪方法,该方法通过无监督学习策略,突破了现有技术的限制,提高了模...