标签：泛化能力

公理训练让LLM学会因果推理：6700万参数模型比肩万亿参数级GPT-4

本文介绍了一种通过公理训练（axiomatic training）学习因果推理的方法，由微软、MIT 和印度理工学院海得拉巴分校（IIT Hyderabad）的研究团队提出。该方法利...

2个月前

CNN一定比Transformer差吗？LeCun新作：神经网络在实践中的灵活性到底有多大？

本文探讨了影响神经网络拟合训练数据能力的多个因素，包括数据本身的性质、模型架构、大小、优化器和正则化器等。实验研究了不同数据集、架构和优化器对神经...

2个月前

用基础模型指导特征传播，首个泛化型图像匹配器OmniGlue搞定未见过域

OmniGlue是由德克萨斯大学奥斯汀分校和谷歌研究院的研究者联合提出的一种可学习图像匹配器，它以泛化能力为核心设计原则。这项技术在图像匹配模型的泛化能力...

3个月前

标记重复词会影响训练效率

论文：

5个月前

智能体的ChatGPT时刻！DeepMind通用AI向人类玩家进化，开始理解游戏

谷歌 DeepMind 宣布了一项新的里程碑式研究，名为 SIMA（Scalable Instructable Multiworld Agent），这是一种适用于 3D 虚拟环境的通用 AI 智能体。SIMA 通...

6个月前

晒应用是一个专注于软件和资源网站分享的导航类网站。我们致力于为用户提供最新、最热门的应用推荐和AI资源，涵盖各种AI绘画、AI制图、AI工具、AI剪辑、AI文本、AI创作、实用工具、免费软件、在线服务和在线影视导航。无论您是寻找最佳的数字工具还是想要了解最新的黑科技应用，晒应用都能满足您的需求。

免责声明免费收录关于我们站点地图

Copyright © 2024 晒应用导航陕ICP备2023005068号-2 由 OneNav 强力驱动