标签:大语言模型

OpenAI开源GPT-4 SAE,提供1600万个解释模式

OpenAI近期在其官网开源了GPT-4的稀疏自动编码器(SAE),这一技术对于开发具有前沿功能的大型语言模型(LLM)至关重要。SAE通过在训练过程中引入稀疏性约束...

谷歌推出TransformerFAM架构,以更低的消耗处理长序列文本

谷歌的研究人员提出了一种全新的架构TransformerFAM,旨在解决传统Transformer架构在处理超长文档时算力负担过重的问题。TransformerFAM通过集成在Transforme...

好莱坞巨星指控OpenAI,ChatGPT山寨她的声音

好莱坞著名影星斯嘉丽·约翰逊近日指控OpenAI的ChatGPT非法使用其声音,并要求下架。斯嘉丽指责ChatGPT中的'Sky'模式与她的声音相似度高达90%以上,怀疑是找人...

谷歌发布Veo:文生超1分钟、1080P视频,媲美Sora

此外,谷歌还发布了多款产品,包括更轻量的大模型Gemini 1.5 Flash、增强版的Gemini 1.5 Pro、第六代AI处理器TPU-Trillium、最新的文生图模型Imagen 3、音乐...

英伟达开源大模型对齐框架—NeMo-Aligner

随着大语言模型(LLM)如ChatGPT和Midjourney在各个领域的广泛应用,确保其输出内容的安全性和可靠性成为了开发人员面临的重要挑战。传统的监督式微调方法在...

CSDI数智+跃迁,产业万象:千行百业的智能创新

步骤2:撰写详细摘要在2023年,人工智能(AI)的发展成为科技与社会影响的焦点,预示着智能化的进化升级。预计到2024年,AI应用产品将大量涌现,推动企业组织...

大语言模型强化的多智能体如何使教育等关键领域受益?

步骤2:撰写摘要总结近日,研究人员推出了一个名为🚀MathVC🚀的“虚拟课堂”,旨在为中学生提供一个练习数学建模技能的平台。该系统通过多个🤖大语言模型(LLM)模...

大模型综述出书了

中国人民大学AI Box团队在2023年3月发表了一篇关于大语言模型的综述文章《A Survey of Large Language Models》,该文章已经更新至第13个版本,正文内容达83...

商汤发布“日日新SenseNova 5.0”大模型,性能对标GPT-4 Turbo

商汤科技在AIGC领域取得显著进展,发布了行业首个“云、端、边”全栈大模型产品矩阵,以满足不同行业的场景化需求。全新发布的“日日新SenseNova 5.0”大模型拥有...

苹果开源OpenELM,大模型开源领域再迎一巨头!

苹果开源大语言模型OpenELM,技术创新与市场策略并重4月24日,苹果公司开源了其大语言模型OpenELM,这一举措与微软开源Phi-3 Mini相似,旨在为移动设备提供专...