标签:开源模型

弥补中文短板,社区Llama3汉化微调版效果如何?

Llama3自发布以来,社区为弥补其在中文能力上的不足,推出了多个中文优化的微调模型。这些模型主要采用中文语料结合SFT(Supervised Fine-Tuning)或增训加SF...

开源闭源争论不休,浅谈大模型开源和闭源

在近期的AI领域,开源模型的火热程度不断上升,引发了业界的广泛关注。开源模型的出现,让大模型行业的竞争愈发激烈。本文将从几个方面探讨开源模型的优势、...

一块钱100万token,超强MoE模型开源,性能直逼GPT-4-Turbo

DeepSeek AI公司近日开源了一款名为DeepSeek-V2的混合专家(MoE)语言模型,该模型在训练成本和推理效率方面具有显著优势。DeepSeek-V2的参数量达到236B,支持1...

大模型竞技场全面测评结果出炉:Llama3 70B成开源模型中最强王者!

摘要:大模型系统组织(LMSYS Org)发布了最新的大模型竞技场全面测评结果,其中Llama3 70B模型在开源模型中表现出色,成为性能最强的模型。这一成就得到了Py...

总结374篇相关工作,陶大程团队联合港大、UMD发布LLM知识蒸馏最新综述

本文讨论了大语言模型(LLMs)的迅速发展及其在科研和工业界的应用。由于闭源LLMs与开源LLMs之间存在差距,研究者致力于提升开源LLMs和其他小模型的能力。知...
12