文章资讯

文本直接生成2分钟视频,即将开源模型StreamingT2V

AIGC领域的新突破: 研究人员来自Picsart人工智能研究所、德克萨斯大学和SHI实验室联合推出了StreamingT2V视频模型,该模型能够通过文本直接生成不同时间长度...

DeepMind终结大模型幻觉?标注事实比人类靠谱、还便宜20倍,全开源

方法概览DeepMind 研究者首先使用 GPT-4 生成 LongFact 提示集,包含 2280 个事实寻求提示,覆盖 38 个主题。LongFact 包含 LongFact-Concepts 和 LongFact-O...

马斯克大模型Grok1.5来了:推理能力大升级,支持128k上下文

Grok-1.5的一个重要升级是其能够处理长达128K token的长上下文,这是之前版本的16倍。这使得模型能够利用更长的文档信息,并在处理复杂提示时保持指令跟踪能...

Attention isn’t all you need!Mamba混合大模型开源:三倍Transformer吞吐量

Jamba 是由 AI21 Labs 开发并开源的一种新型生成式人工智能模型,旨在解决传统 transformer 架构的内存占用和推理速度问题。Jamba 结合了结构化状态空间模型...

AI创业吧!不缺计算资源那种

在AI技术不断进步的今天,AI创业已经成为一个热门话题。阿里云创业者计划「预见 2024:AI 创变者」活动为创业者提供了一个交流平台,让创业者们能够更好地了...

AI21推出基于Mamba架构的生产级大模型Jamba,52B参数,单卡140K上下文推理,模型开源!

Jamba是首个SSM-Transformer混合架构的生产级大模型,相比Mixtral 8x7B,在处理长上下文时吞吐量提高了3倍。它在单个GPU上可容纳高达140K上下文,是唯一一个...

Jason Wei点赞!Google DeepMind推出新的大模型幻觉评估方案,模型越大越事实精准

发现1:LLMs可以生成大规模的提示集。使用GPT-4生成LongFact,包含38个主题的2,000多个提示。发现2:LLMs可以用作事实性的自动评级器。提出了SAFE,将回答分...

亚马逊追投Anthropic 27.5亿刀,市值暴涨5000亿!

亚马逊对人工智能研究公司Anthropic追加了27.5亿美元的投资,兑现了去年底承诺的40亿美元投资。Anthropic最近推出的Claude 3模型在性能上超过了GPT-4,这使得...

CVPR 2024|生成不了光线极强的图片?微信视觉团队有效解决扩散模型奇点问题

微信视觉团队与中山大学合作,针对扩散模型中的奇点问题提出了一个即插即用的方法SingDiffusion,有效解决了初始时刻的采样问题,显著提升了现有扩散模型的生...

看视频、画CAD、运动想像识别!75B的多模态工业大模型太能干了

创新奇智发布奇智孔明工业大模型2.0版本创新奇智发布了奇智孔明工业大模型2.0版本(AInno-75B),在规模和性能方面取得了显著增长。新版本引入了多模态大模型...