标签：开源模型

弥补中文短板，社区Llama3汉化微调版效果如何？

Llama3自发布以来，社区为弥补其在中文能力上的不足，推出了多个中文优化的微调模型。这些模型主要采用中文语料结合SFT（Supervised Fine-Tuning）或增训加SF...

4个月前

在近期的AI领域，开源模型的火热程度不断上升，引发了业界的广泛关注。开源模型的出现，让大模型行业的竞争愈发激烈。本文将从几个方面探讨开源模型的优势、...

4个月前

DeepSeek AI公司近日开源了一款名为DeepSeek-V2的混合专家(MoE)语言模型，该模型在训练成本和推理效率方面具有显著优势。DeepSeek-V2的参数量达到236B，支持1...

4个月前

摘要：大模型系统组织（LMSYS Org）发布了最新的大模型竞技场全面测评结果，其中Llama3 70B模型在开源模型中表现出色，成为性能最强的模型。这一成就得到了Py...

5个月前

...

6个月前

本文讨论了大语言模型（LLMs）的迅速发展及其在科研和工业界的应用。由于闭源LLMs与开源LLMs之间存在差距，研究者致力于提升开源LLMs和其他小模型的能力。知...

6个月前