文章资讯

CVPR 2024|让视频姿态Transformer变得飞速,北大提出高效三维人体姿态估计框架HoT

摘要:本文介绍了一种名为Hourglass Tokenizer(HoT)的高效三维人体姿态估计框架,由北京大学团队提出,旨在解决现有视频姿态Transformer(VPT)模型高计算...

LMa-UNet: 探索大kernel Mamba在医学图像分割上的潜力

摘要:本文提出了一种基于大kernel或大window的Mamba模块,用于增强状态空间模型(SSM)的表示建模能力。该模块通过分层和双向的方式同时建模全局和局部关系...

CVPR 2024 | 面部+肢体动画,一个框架搞定从音频生成数字人表情与动作

EMAGE研究论文分为BEAT2和EMAGE两部分。BEAT2是一个包含60小时数据的全身数据集,结合了SMPLX的肢体和FLAME的面部参数,提供了一个标准化且高质量的3D动捕数...

微软、OpenAI又搞大动作:斥资1000亿美元开发AI超算「星际之门」

微软和 OpenAI 正在解决技术挑战,如提高 GPU 密度和防止芯片过热。Stargate 的目标是让双方能够使用除英伟达外其他公司如 Advanced Micro Devices 生产的 GP...

吴恩达:别光盯着GPT-5,用GPT-4做个智能体可能提前达到GPT-5的效果

吴恩达:AI 智能体的未来吴恩达在演讲中提出,AI智能体的潜力被低估了,并且通过智能体工作流,即使是GPT-3.5也能表现得比GPT-4更好。他强调,智能体工作流不...

CVPR 2024 | 让视频姿态Transformer变得飞速,北大提出高效三维人体姿态估计框架HoT

本文介绍了一种名为Hourglass Tokenizer(HoT)的高效三维人体姿态估计框架,旨在解决现有Video Pose Transformer(VPT)模型高计算需求的问题。HoT通过剪枝...

全日程发布|Sora之后的视频生成技术与应用

论坛将邀请行业内知名专家和一线技术负责人进行演讲,如张俊林、朱思语、曾妍、陈石、杨欢、高一钊、王耀晖、卞正达和童同。他们将分享视频生成领域的技术突...

ICLR 2024 | 鸡生蛋蛋生鸡?再论生成数据能否帮助模型训练

生成数据对表示学习的影响生成数据的质量对表示学习有显著影响。研究表明,真实数据与生成数据的混合比例在10:1时达到最优,说明真实数据的训练价值远高于生...

AI行业买英伟达GPU,花的钱比赚的多17倍

文章首先介绍了 Cognition Labs,这是一家专注于生成式 AI 的初创公司,由 Scott Wu 联合创立,团队成员包括多位国际信息学奥林匹克竞赛的金牌选手。Cognitio...

告别微软,姜大昕带领这支精英团队攀登Scaling Law,万亿参数模型已有预览版

攀登 Scaling Law 的决心姜大昕强调了攀登Scaling Law的重要性,认为这是通向AGI的必经之路。他分享了大模型演进的三个阶段:独立模态发展、多模态融合、具身...
19192939495114