标签:泛化能力

公理训练让LLM学会因果推理:6700万参数模型比肩万亿参数级GPT-4

本文介绍了一种通过公理训练(axiomatic training)学习因果推理的方法,由微软、MIT 和印度理工学院海得拉巴分校(IIT Hyderabad)的研究团队提出。该方法利...

CNN一定比Transformer差吗?LeCun新作:神经网络在实践中的灵活性到底有多大?

本文探讨了影响神经网络拟合训练数据能力的多个因素,包括数据本身的性质、模型架构、大小、优化器和正则化器等。实验研究了不同数据集、架构和优化器对神经...

用基础模型指导特征传播,首个泛化型图像匹配器OmniGlue搞定未见过域

OmniGlue是由德克萨斯大学奥斯汀分校和谷歌研究院的研究者联合提出的一种可学习图像匹配器,它以泛化能力为核心设计原则。这项技术在图像匹配模型的泛化能力...

智能体的ChatGPT时刻!DeepMind通用AI向人类玩家进化,开始理解游戏

谷歌 DeepMind 宣布了一项新的里程碑式研究,名为 SIMA(Scalable Instructable Multiworld Agent),这是一种适用于 3D 虚拟环境的通用 AI 智能体。SIMA 通...