AI最新资讯

波士顿动力技术揭秘:后空翻、俯卧撑与翻车,6年经验、教训总结

波士顿动力公司以其先进的人形机器人Atlas而闻名。该公司最初使用液压系统,但后来转向电动版本,以提高灵活性和适应工业环境。Atlas的研发历程在机器人技术...

一年秀一次!稚晖君的人形机器人上新了,还有开源、免费彩蛋

智元机器人公司在2024年的发布会上,展示了其第二代人形机器人产品线,包括交互服务机器人远征A2、柔性智造机器人远征A2-W和重载特种机器人远征A2-Max,以及...

即插即用,效率远超ControlNet!贾佳亚团队重磅开源ControlNeXt:超强图像视频生成方法

ControlNeXt:先进图像视频生成技术ControlNeXt是一种新型的图像和视频生成技术,它通过简化的架构和交叉归一化技术,大幅减少了延迟和参数量,提高了生成效...

ECCV 2024|POA:已开源,蚂蚁集团提出同时预训练多种尺寸网络的自监督范式

POA自监督学习框架的核心是引入了一个创新的弹性student分支,该分支通过参数共享嵌入了一系列子网络,这些子网络是基于观察到现代网络结构中,较小尺寸的模...

ECCV 2024 Oral 满分论文!SpikeYOLO:高性能低能耗目标检测网络

摘要:本文介绍了一种新型的目标检测框架SpikeYOLO,以及一种新型的脉冲神经元——I-LIF神经元。SpikeYOLO框架结合了YOLOv8的宏观设计与Meta-SpikeFormer的微观...

首个全自动科学发现AI系统,Transformer作者创业公司Sakana AI推出AI Scientist

AI Scientist的推出是人工智能在科学研究领域的重要突破,它通过自动化发现过程和整合AI驱动的审查系统,为解决最具挑战性的科学技术问题提供了新的可能性。...

李沐:创业一年,人间三年

1. 创业初衷:作者在Amazon工作7年半后决定创业,认为创业是人生中值得尝试的事情,越早开始越好。2. 公司命名:BosonAI的命名来源于量子物理中的玻色子,象...

综述|多模态大模型有何进展?西工大等最新《多模态大型语言模型》

在数据爆炸性增长和技术快速发展的背景下,多模态大型语言模型(MLLMs)正成为人工智能(AI)系统的前沿。MLLMs通过整合文本、图像、视频、音频和生理序列等...

ECCV’24|图像文本擦除无痕迹!复旦提出EAFormer:最新场景文本分割新SOTA!

本文介绍了一种名为边缘感知Transformer(EAFormer)的新型文本分割方法,旨在提高场景文本分割任务中文本边缘的准确性。EAFormer通过明确预测文本边缘并利用...

跟最新热点,做最快paper!BioSAM2:SAM-2在医疗领域的应用落地

本文介绍了BioSAM 2,这是一个针对生物医学图像和视频分割任务优化的SAM 2基础模型。通过微调原始的SAM 2,BioSAM 2在没有提示的情况下展现出显著的性能提升...
11314151617114