标签:模型能力

这些VLM竟都是盲人?GPT-4o、Sonnet-3.5相继败于「视力」测试

研究背景与目的视觉语言模型(VLMs)近年来取得了显著进展,能够理解图像内容并用语言描述,甚至执行复杂任务。然而,现有基准测试集并不能完全评估VLMs的视...