文章资讯

开源大模型王座再易主，1320亿参数DBRX上线，基础、微调模型都有

Databricks公司发布了一款1320亿参数的混合专家模型（MoE）DBRX，超越了其他大模型如Llama 2、Mistral和Grok-1。DBRX在语言理解、编程、数学和逻辑等方面的性...

6个月前

摘要：文章来源于知乎问答，讨论了研究生在科研过程中如何复现前辈的实验结果。一位作者通过软件工程方法解决了代码复现问题，强调科研代码应该是可复现的。...

6个月前

SELF-DISCOVER可以引导大语言模型根据一组给定的原子推理模块，自行选择、调整和组合这些模块，形成一个用于解决特定任务的推理结构。这种结构不仅结合了多个...

6个月前

Databricks开源了一款名为DBRX的1320亿参数大模型，该模型基于专家混合模型（MoE）架构，具备文本生成、代码编写和数学推理等能力。DBRX的性能在多个测试中超...

6个月前

摘要：本文介绍了一种新的医学图像分割方法D-Net，该方法将动态大核（DLK）模块和动态特征融合（DFF）模块整合到分层Transformer架构中。DLK模块使用多个不同...

6个月前

Uni-RLHF平台的亮点：- 多反馈类型通用标注平台：支持多种在线环境和离线数据集，具有查询采样器、交互式用户界面和反馈翻译器等功能。- 适用于强化学习的标...

6个月前

摘要：Latte模型是一个开源的文生视频DiT模型，由上海人工智能实验室的研究团队联合其他机构开发。该模型旨在解决将DiT模型扩展到视频生成领域的挑战。文章详...

6个月前

文章介绍了一种新的文生视频方法——StreamingT2V，由Picsart AI Research等多个机构联合提出。该方法能够生成具有时间一致性的长视频，解决了现有方法在生成长...

6个月前

在博鳌亚洲论坛上发布的《2024年中国AI大模型产业发展报告》中，探讨了中国AI大模型的发展现状、典型案例以及面临的挑战，并对未来趋势进行了展望。报告指出...

6个月前

文章强调，模型部署与优化是自动驾驶公司的重要任务，需要考虑多个关键因素。FLOPS和TOPS是衡量计算性能的重要指标，但实际应用中的性能可能会有所不同。CUDA...

6个月前