文章资讯

让智能体像孩子一样观察别人学习动作,跨视角技能学习数据集EgoExoLearn来了

研究背景 人类具有观察他人行为并映射到自己视角的能力,这对于AI智能体在通用场景中执行任务非常重要。目前AI智能体训练通常需要相同视角的演示视频,而直...

值得你花时间看的扩散模型教程,来自普渡大学

这篇由机器之心报道的文章介绍了扩散模型(Diffusion Model)在图像生成领域的应用和进展。文章首先解释了扩散模型是一种不同于GAN和VAE的图像生成模型,它通...

攻陷短视频后,Sora将需要72万块H100 GPU

文章主要讨论了 OpenAI 推出的 Sora 模型,这是一个建立在扩散 Transformers(DiT)之上的扩散模型,用于生成逼真的视频内容。Sora 证明了扩大视频模型的有效...

AI无人商店背后,是上千个印度人通过摄像头看美国人买西蓝花?

亚马逊的Just Walk Out技术允许顾客在无人商店中挑选商品后直接离开,无需排队结账。该技术结合了计算机视觉、目标识别、高级传感器、深度机器学习模型和生成...

开源大模型可能不香了!您在微调开源大模型的时候,很可能已经泄露了您宝贵的数据!

研究人员通过设计一个“锁”来实现后门在微调期间仅执行一次,并将这一后门设计扩展到Transformers模型中。此外,研究还展示了在更强的黑盒设置中,攻击者可以...

苹果可能已打算进军家庭服务机器人领域,下一个大事件!

苹果公司正在探索进入个人机器人领域的可能,这可能成为其下一个重大项目。据知情人士透露,苹果工程师正在研究一种移动机器人,能够在家中跟随用户移动,并...

文本生成3分钟44.1 kHz 音乐,Stable Audio 2.0重磅发布!

Stable Audio 2.0发布:Stability.ai发布了音频模型Stable Audio 2.0,支持生成长达3分钟44.1 kHz的高质量音乐,超过谷歌和Meta的同类产品。新版本使用了Diff...

微软与Quantinuum合作,实现量子计算重大突破!

量子计算领域取得重大突破,Quantinuum与微软宣布在实现容错量子计算方面取得重要进展。通过采用微软的量子比特虚拟化系统,Quantinuum成功创建了四个逻辑量...

OpenAI发布全新微调API :ChatGPT支持更详细可视化微调啦!

OpenAI在其官网宣布新增6个微调API功能,旨在帮助企业和开发人员构建特定领域的ChatGPT应用。这些功能包括基于Epoch的检查点创建、Playground新功能、第三方...

百万用户通话新风潮:仅需50秒,无界AI让彩铃变身短视频

无界AI是杭州超节点信息科技有限公司创立的人工智能生成内容(AIGC)平台,专注于图像视频领域的生成创造,提供丰富的AIGC工具,满足多行业内容生产需求。平...
19394959697118