标签:自动驾驶

Andrej Karpathy最新激进观点:Transformer将超越人脑

Andrej Karpathy,前OpenAI成员及特斯拉自动驾驶计算机视觉团队领导者,近期在播客节目No Priors中分享了他对AI未来的看法。他认为,Transformer模型在性能上...

自动接人,手机开车,特斯拉纯视觉无人召唤终于来了

特斯拉的“真智能召唤”(ASS)功能即将在下周通过2024.27.20版本软件更新向用户推出,这标志着特斯拉在自动驾驶技术上的又一重要进展。该功能允许车主通过手机...

ACM Multimedia 2024 Oral|自动驾驶场景下面向真实世界布局的转变

本文介绍了一种创新的多模态场景适应方法,名为DCF(Depth-guided Contextual Filter),该方法被ACM Multimedia 2024选为口头报告。DCF通过深度感知的类别过...

买不到GPU,马斯克自曝AI巨兽Dojo!自研超算挑战英伟达,约等于8千块H100

Dojo超算集群由10万块H100 GPU和特斯拉自家的HW4、AI5芯片组成,预计将在2024年10月达到100 exaflops的总计算能力。特斯拉还在研发下一代D2芯片,以解决信息...

CVPR24|MASA开源:刷新监督学习SOTA,无监督多目标跟踪时代来临!

摘要:本文介绍了一种名为MASA(Matching Anything by Segmenting Anything)的多目标跟踪方法,该方法通过无监督学习策略,突破了现有技术的限制,提高了模...

最新决议,老黄涨薪60%!英伟达股东大会通过,可老黄在偷偷卖股票

在英伟达的股东大会上,公司CEO黄仁勋(老黄)宣布了多项重要信息和公司的未来方向。以下是对这次大会内容的详细总结:1. 薪酬增长:黄仁勋在2024财年的总薪...

视觉 AI 的「Foundation Model」,已经发展到哪一步?丨CVPR 2024 现场直击

在2024年的IEEE国际计算机视觉与模式识别会议(CVPR)上,视觉Foundation Model成为了核心议题之一,与自动驾驶、3D视觉等传统研究课题并列。AIGC(人工智能...

ECCV 2024 Workshop自动驾驶难例场景多模态理解与视频生成征稿与挑战赛火热启动!

摘要:ECCV 2024会议将举办一个名为W-CODA Workshop的研讨会,专注于自动驾驶难例场景的多模态理解与视频生成。这个研讨会的核心目标是缩小当前自动驾驶技术...

Yann LeCun:ViT慢且效率低,实时图像处理还得看卷积

在当前的人工智能领域,关于Vision Transformer(ViT)与传统卷积神经网络(CNN)哪个更优越的争论一直存在。今年初,OpenAI的Sora模型使得ViT架构受到关注。...

Sora是世界模拟器吗?全球首篇综述全面解析通用世界模型

步骤2:撰写摘要近日,北京极佳视界科技有限公司(极佳科技)联合多家单位发布了全球首篇通用世界模型综述。该综述通过260余篇文献,全面探索了世界模型在视...
12