标签:计算效率

DeepMind升级Transformer,前向通过FLOPs最多可降一半

DeepMind 的最新研究提出了一种名为 Mixture-of-Depths(MoD)的 Transformer 改进方法,旨在提高语言模型的计算效率。MoD 通过动态地为每个 token 分配计算...

CVPR 2024 | 让视频姿态Transformer变得飞速,北大提出高效三维人体姿态估计框架HoT

本文介绍了一种名为Hourglass Tokenizer(HoT)的高效三维人体姿态估计框架,旨在解决现有Video Pose Transformer(VPT)模型高计算需求的问题。HoT通过剪枝...