标签:大语言模型

GPT-4系列模型,在文档理解中的多维度评测

Snowflake研究人员发布的论文深入探讨了OpenAI的GPT-4系列模型在文本生成、图像理解、文档摘要等方面的能力。通过对GPT-4、GPT-4 V、GPT-4 Turbo V +OCR等模...

英伟达开源最强通用模型Nemotron-4 340B

英伟达宣布推出Nemotron-4 340B,包含一系列开源模型,开发人员可以使用这些模型生成合成数据,用于训练大语言模型(LLM),适用于医疗健康、金融、制造、零...

现在起,真正的强者敢于直面「扣子」的「模型广场」

1. 模型广场的基本概念:这是一个在线的大语言模型对比与评估系统,支持国内多个知名主流大语言模型作为底座,如豆包、通义千问等。用户可以通过这个平台,对...

万字综述大模型高效推理:无问芯穹与清华、上交最新联合研究全面解析大模型推理优化

近年来,大语言模型(LLMs)在各种语言生成任务上展现出卓越的能力,推动了人工智能应用的发展。然而,其落地应用受到推理开销大、部署资源需求高、用户体验...

能精准解读X光片,开源视觉大模型Dragonfly

Together.ai开源了一个名为Dragonfly的多分辨率视觉大语言模型,该模型专注于AIGC领域,并对大语言模型(LLM)的发展和应用落地进行了深入研究。Dragonfly包...

重磅!OpenAI与苹果合作,将ChatGPT集成在iOS 18中

OpenAI与苹果公司宣布达成技术合作,将ChatGPT深度集成至苹果的iOS、iPadOS和macOS系统中。这一合作将允许苹果用户在移动设备上原生使用ChatGPT进行图片生成...

媲美Sora,最长2分钟!快手发布文生视频大模型-可灵

快手AI团队发布了一款名为“可灵”的文生视频大模型,专注于AIGC领域的发展和应用落地。可灵模型能够通过文本生成2分钟、1080P、每秒30帧的超长视频,其在色彩...

OpenAI首次公开前沿大模型安全:基础架构、保护措施等

AIGC开放社区近日对OpenAI公开的大模型安全策略进行了深入解读。6月6日,OpenAI在其官网上首次系统性地公布了大模型开发安全方面的高级细节,包括基础架构、...

超越DPO,创新大模型优化算法SimPO

摘要总结AIGC领域的专业社区关注了微软、OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地。随着ChatGPT等模型的影响力日益增强,如何根...

OpenAI开源GPT-4 SAE,提供1600万个解释模式

OpenAI近期在其官网开源了GPT-4的稀疏自动编码器(SAE),这一技术对于开发具有前沿功能的大型语言模型(LLM)至关重要。SAE通过在训练过程中引入稀疏性约束...