文章资讯

老黄一口气解密三代GPU!粉碎摩尔定律打造AI帝国,量产Blackwell解决ChatGPT全球耗电难题

在最近的一次演讲中,英伟达的CEO黄仁勋展示了Blackwell芯片,这是一款迄今为止世界上最大的芯片,被他誉为“全世界迄今为止制造出来的最复杂、性能最高的计算...

谷歌创新框架:从非结构化数据,实现多模态学习

本文主要探讨了在AIGC领域中,多模态学习的重要性以及谷歌提出的LANISTR框架如何解决多模态学习中的难题。多模态学习是大模型发展的关键方向,它涉及到将文本...

搞定视频任务泛化,VLM 还有机会吗?

本期机器之心PRO会员通讯周报第22期,深入探讨了AI和机器人领域的三个重要议题。首先,讨论了视频任务泛化对具身智能的重要性,以及视觉语言模型(VLM)在视...

多模态大模型不够灵活,谷歌DeepMind创新架构Zipper:分开训练再「压缩」

Zipper架构通过两个自回归解码器tower的结合,实现了多模态生成能力。每个tower使用下一个token预测功能分别对单个模态进行训练,并在交叉注意力层中实现模态...

上海交大卢策吾:具身智能与他的首个刮胡子机器人 | 智者访谈

在2024年AI领域的热点之一是“具身智能”。上海交通大学的卢策吾教授是这一领域的专家,他领导的团队研发了一种能够为人类刮胡子的机器人。这一看似简单的任务...

人人都能制作动漫视频,神鬼寓言推出Showrunner

神鬼寓言工作室推出的文生视频产品Showrunner,允许用户通过输入文本提示快速制作动漫视频,支持自定义剧本、运镜、配音等专业功能,并提供了一个分享平台。...

中国发布《生成式AI安全基本要求》,涵盖训练数据、生成内容等

全国网络安全标准化技术委员会发布了《网络安全技术 生成式人工智能服务安全基本要求》征求意见稿,旨在加强生成式人工智能(AI)的安全性。意见稿分为三部分...

赋予机器人思考能力!SC-MLLM: 构建自我纠正多模态大模型赋能端到端机器人操作

摘要机器人操作策略在面对新的任务或对象时,表现出不理想的动作表现。因此,具备自动检测和自我纠正失败动作的能力对于一个实用的机器人系统至关重要。最近...

ICML’24|即插即用无需训练,几行代码提升Diffusion性能!DSG: 基于球面高斯约束引导的条件扩散模型

本文介绍了上海科技大学YesAI Lab在ICML 2024上发表的关于条件扩散模型的研究工作《Guidance with Spherical Gaussian Constraint for Conditional Diffusion...

超长小说可以用AI翻译了,新型多智能体协作系统媲美人工翻译

在机器翻译领域,文学翻译一直是一个挑战,因为其语言复杂性、隐喻表达和文化差异。最近,一项研究提出了一种基于大型语言模型(LLM)的新型多智能体框架,旨...
15657585960119