标签:图像识别

如何让等变神经网络可解释性更强?试试将它分解成「简单表示」

神经网络在图像识别等应用中展现出强大的函数近似能力,但当涉及到对称性时,等变神经网络(equivariant neural networks)提供了一种更为灵活的框架。近期,...

这些VLM竟都是盲人?GPT-4o、Sonnet-3.5相继败于「视力」测试

研究背景与目的视觉语言模型(VLMs)近年来取得了显著进展,能够理解图像内容并用语言描述,甚至执行复杂任务。然而,现有基准测试集并不能完全评估VLMs的视...

15个目标检测开源数据集汇总

摘要总结:本文为深度学习者和计算机视觉研究者提供了15个目标检测相关的开源数据集,旨在帮助他们在该领域的学习和研究。这些数据集涵盖了从火焰和烟雾检测...