标签：大语言模型

OpenAI开源GPT-4 SAE，提供1600万个解释模式

OpenAI近期在其官网开源了GPT-4的稀疏自动编码器（SAE），这一技术对于开发具有前沿功能的大型语言模型（LLM）至关重要。SAE通过在训练过程中引入稀疏性约束...

3个月前

谷歌的研究人员提出了一种全新的架构TransformerFAM，旨在解决传统Transformer架构在处理超长文档时算力负担过重的问题。TransformerFAM通过集成在Transforme...

4个月前

好莱坞著名影星斯嘉丽·约翰逊近日指控OpenAI的ChatGPT非法使用其声音，并要求下架。斯嘉丽指责ChatGPT中的'Sky'模式与她的声音相似度高达90%以上，怀疑是找人...

4个月前

此外，谷歌还发布了多款产品，包括更轻量的大模型Gemini 1.5 Flash、增强版的Gemini 1.5 Pro、第六代AI处理器TPU-Trillium、最新的文生图模型Imagen 3、音乐...

4个月前

随着大语言模型（LLM）如ChatGPT和Midjourney在各个领域的广泛应用，确保其输出内容的安全性和可靠性成为了开发人员面临的重要挑战。传统的监督式微调方法在...

4个月前

步骤2：撰写详细摘要在2023年，人工智能（AI）的发展成为科技与社会影响的焦点，预示着智能化的进化升级。预计到2024年，AI应用产品将大量涌现，推动企业组织...

4个月前

步骤2：撰写摘要总结近日，研究人员推出了一个名为🚀MathVC🚀的“虚拟课堂”，旨在为中学生提供一个练习数学建模技能的平台。该系统通过多个🤖大语言模型（LLM）模...

5个月前

中国人民大学AI Box团队在2023年3月发表了一篇关于大语言模型的综述文章《A Survey of Large Language Models》，该文章已经更新至第13个版本，正文内容达83...

5个月前

商汤科技在AIGC领域取得显著进展，发布了行业首个“云、端、边”全栈大模型产品矩阵，以满足不同行业的场景化需求。全新发布的“日日新SenseNova 5.0”大模型拥有...

5个月前

苹果开源大语言模型OpenELM，技术创新与市场策略并重4月24日，苹果公司开源了其大语言模型OpenELM，这一举措与微软开源Phi-3 Mini相似，旨在为移动设备提供专...

5个月前