标签:DiG模型

DiG:使用门控线性注意力机制的高效可扩展 Diffusion Transformer

本文介绍了一种新型的扩散模型——DiG(Diffusion Gated Linear Attention Transformers),由华中科技大学和字节跳动的研究团队共同开发。DiG模型通过引入门控...