文章资讯

让智能体像孩子一样观察别人学习动作，跨视角技能学习数据集EgoExoLearn来了

研究背景人类具有观察他人行为并映射到自己视角的能力，这对于AI智能体在通用场景中执行任务非常重要。目前AI智能体训练通常需要相同视角的演示视频，而直...

5个月前

这篇由机器之心报道的文章介绍了扩散模型（Diffusion Model）在图像生成领域的应用和进展。文章首先解释了扩散模型是一种不同于GAN和VAE的图像生成模型，它通...

5个月前

文章主要讨论了 OpenAI 推出的 Sora 模型，这是一个建立在扩散 Transformers（DiT）之上的扩散模型，用于生成逼真的视频内容。Sora 证明了扩大视频模型的有效...

5个月前

亚马逊的Just Walk Out技术允许顾客在无人商店中挑选商品后直接离开，无需排队结账。该技术结合了计算机视觉、目标识别、高级传感器、深度机器学习模型和生成...

5个月前

研究人员通过设计一个“锁”来实现后门在微调期间仅执行一次，并将这一后门设计扩展到Transformers模型中。此外，研究还展示了在更强的黑盒设置中，攻击者可以...

5个月前

苹果公司正在探索进入个人机器人领域的可能，这可能成为其下一个重大项目。据知情人士透露，苹果工程师正在研究一种移动机器人，能够在家中跟随用户移动，并...

5个月前

Stable Audio 2.0发布：Stability.ai发布了音频模型Stable Audio 2.0，支持生成长达3分钟44.1 kHz的高质量音乐，超过谷歌和Meta的同类产品。新版本使用了Diff...

5个月前

量子计算领域取得重大突破，Quantinuum与微软宣布在实现容错量子计算方面取得重要进展。通过采用微软的量子比特虚拟化系统，Quantinuum成功创建了四个逻辑量...

5个月前

OpenAI在其官网宣布新增6个微调API功能，旨在帮助企业和开发人员构建特定领域的ChatGPT应用。这些功能包括基于Epoch的检查点创建、Playground新功能、第三方...

5个月前

无界AI是杭州超节点信息科技有限公司创立的人工智能生成内容（AIGC）平台，专注于图像视频领域的生成创造，提供丰富的AIGC工具，满足多行业内容生产需求。平...

6个月前