文章资讯

开源大模型王座再易主,1320亿参数DBRX上线,基础、微调模型都有

Databricks公司发布了一款1320亿参数的混合专家模型(MoE)DBRX,超越了其他大模型如Llama 2、Mistral和Grok-1。DBRX在语言理解、编程、数学和逻辑等方面的性...

同组博士师兄的结果复现不出来,我应该怎么办?

摘要:文章来源于知乎问答,讨论了研究生在科研过程中如何复现前辈的实验结果。一位作者通过软件工程方法解决了代码复现问题,强调科研代码应该是可复现的。...

谷歌推出”自我发现“框架,极大增强GPT-4等大模型推理能力

SELF-DISCOVER可以引导大语言模型根据一组给定的原子推理模块,自行选择、调整和组合这些模块,形成一个用于解决特定任务的推理结构。这种结构不仅结合了多个...

1320亿参数,性能超LLaMA2、Grok-1!开源大模型DBRX

Databricks开源了一款名为DBRX的1320亿参数大模型,该模型基于专家混合模型(MoE)架构,具备文本生成、代码编写和数学推理等能力。DBRX的性能在多个测试中超...

复旦大学提出D-Net:Transformer中融合动态大卷积核&动态特征融合模块,让分割效果骤升

摘要:本文介绍了一种新的医学图像分割方法D-Net,该方法将动态大核(DLK)模块和动态特征融合(DFF)模块整合到分层Transformer架构中。DLK模块使用多个不同...

ICLR 2024 | RLHF有了通用平台和基准,天大开源,专攻现实决策场景

Uni-RLHF平台的亮点:- 多反馈类型通用标注平台:支持多种在线环境和离线数据集,具有查询采样器、交互式用户界面和反馈翻译器等功能。- 适用于强化学习的标...

详解Latte:去年底上线的全球首个开源文生视频DiT

摘要:Latte模型是一个开源的文生视频DiT模型,由上海人工智能实验室的研究团队联合其他机构开发。该模型旨在解决将DiT模型扩展到视频生成领域的挑战。文章详...

两分钟1200帧的长视频生成器StreamingT2V来了,代码将开源

文章介绍了一种新的文生视频方法——StreamingT2V,由Picsart AI Research等多个机构联合提出。该方法能够生成具有时间一致性的长视频,解决了现有方法在生成长...

今年,中国AI大模型产业发展看这些

在博鳌亚洲论坛上发布的《2024年中国AI大模型产业发展报告》中,探讨了中国AI大模型的发展现状、典型案例以及面临的挑战,并对未来趋势进行了展望。报告指出...

Cuda与TensorRT模型部署,优化及实践方案

文章强调,模型部署与优化是自动驾驶公司的重要任务,需要考虑多个关键因素。FLOPS和TOPS是衡量计算性能的重要指标,但实际应用中的性能可能会有所不同。CUDA...
19899100101102119