标签:视觉语言理解

开源性能最强!中大和美团提出OV-DINO:语言感知的开放域目标检测方法!

摘要:中山大学和美团联合提出一种新型的开放域检测方法OV-DINO,该方法通过语言感知选择性融合和统一数据集成,实现了在开放域检测任务中的显著性能提升。OV...