标签：LLM

英伟达最新技术分享：手把手教你用Llama 3.1合成数据改进模型！附代码

英伟达在其技术博客中详细介绍了如何利用Llama 3.1模型生成合成数据，以支持领域模型或RAG系统的微调。合成数据在AI领域已有十多年的应用历史，但其重要性随...

1个月前

详细摘要：大型语言模型（LLM）在文本补全和内容创作方面展现出了强大的生成能力，但生成符合JSON格式的结构化数据仍然是一个挑战。本文通过`lm-format-enfor...

1个月前

摘要：微软发布了一款名为GraphRAG的开源方案，该方案通过结合知识图谱与检索增强式生成（RAG）技术，显著提升了大型语言模型（LLM）的生成质量和结果的有用...

2个月前

在探讨大型语言模型（LLM）的数学推理能力时，菲尔兹奖得主Timothy Gowers对GPT-4o进行了一项测试，以解决经典的“狼-山羊-卷心菜”过河问题。结果显示，即使是...

2个月前

近日，马库斯的一句「Is scaling all you need?」引发了正反两方的论战。自GPT-4发布以来，尽管有约500亿美元投资在芯片上，但至今仍无模型能超越GPT-4，引发...

3个月前

多token预测是一种新型的预训练方法，旨在提高大语言模型（LLM）的推理效率。这种方法要求模型在每个位置上同时预测接下来的n个Token，而不是像传统的下一个T...

3个月前

本文介绍了AnyGPT，一种新型的any-to-any多模态大型语言模型（LLM），由复旦大学和上海AI Lab共同开发。AnyGPT能够统一处理包括语音、文本、图像和音乐在内的...

4个月前

步骤2：撰写摘要Snowflake公司发布了一款名为Arctic的顶级大型语言模型（LLM），专注于企业级应用。Arctic模型具备两个主要优势：高效智能和开源开放。在企业...

4个月前

OpenAI在亚洲设立首个办事处，并针对日语优化GPT-4模型，推理速度提升3倍，提高日文理解与文本生成精准度。日本办事处由长崎忠雄负责，旨在加速全球化市场布...

5个月前

OpenAI在其API仪表盘中新增了“项目”管理功能，旨在帮助企业和个人开发者更精细化地管理和跟踪模型。这项功能对于需要精细管理模型使用的大型企业和复杂部门的...

5个月前