文章资讯

文本直接生成2分钟视频，即将开源模型StreamingT2V

AIGC领域的新突破：研究人员来自Picsart人工智能研究所、德克萨斯大学和SHI实验室联合推出了StreamingT2V视频模型，该模型能够通过文本直接生成不同时间长度...

6个月前

方法概览DeepMind 研究者首先使用 GPT-4 生成 LongFact 提示集，包含 2280 个事实寻求提示，覆盖 38 个主题。LongFact 包含 LongFact-Concepts 和 LongFact-O...

6个月前

Grok-1.5的一个重要升级是其能够处理长达128K token的长上下文，这是之前版本的16倍。这使得模型能够利用更长的文档信息，并在处理复杂提示时保持指令跟踪能...

6个月前

Jamba 是由 AI21 Labs 开发并开源的一种新型生成式人工智能模型，旨在解决传统 transformer 架构的内存占用和推理速度问题。Jamba 结合了结构化状态空间模型...

6个月前

在AI技术不断进步的今天，AI创业已经成为一个热门话题。阿里云创业者计划「预见 2024：AI 创变者」活动为创业者提供了一个交流平台，让创业者们能够更好地了...

6个月前

Jamba是首个SSM-Transformer混合架构的生产级大模型，相比Mixtral 8x7B，在处理长上下文时吞吐量提高了3倍。它在单个GPU上可容纳高达140K上下文，是唯一一个...

6个月前

发现1：LLMs可以生成大规模的提示集。使用GPT-4生成LongFact，包含38个主题的2,000多个提示。发现2：LLMs可以用作事实性的自动评级器。提出了SAFE，将回答分...

6个月前

亚马逊对人工智能研究公司Anthropic追加了27.5亿美元的投资，兑现了去年底承诺的40亿美元投资。Anthropic最近推出的Claude 3模型在性能上超过了GPT-4，这使得...

6个月前

微信视觉团队与中山大学合作，针对扩散模型中的奇点问题提出了一个即插即用的方法SingDiffusion，有效解决了初始时刻的采样问题，显著提升了现有扩散模型的生...

6个月前

创新奇智发布奇智孔明工业大模型2.0版本创新奇智发布了奇智孔明工业大模型2.0版本（AInno-75B），在规模和性能方面取得了显著增长。新版本引入了多模态大模型...

6个月前