标签:DiT

不懂就问,DiT能量化到只有4位吗?HQ-DiT:高效的 FP4 混合精度量化 DiT

本文介绍了一种针对扩散变换器(Diffusion Transformer,简称DiT)的高效混合精度量化方法HQ-DiT,该方法使用4位浮点数(FP4)对DiT进行量化,显著提升了推理...

DiT架构大一统:一个框架集成图像、视频、音频和3D生成,可编辑、能试玩

摘要:背景:AI社区通过Sora模型的发布,看到了基础扩散模型在生成真实图像和视频方面的潜力。然而,现有模型在设计选择上提供有限的指导,缺乏详细的实现说...

文本生成3分钟44.1 kHz 音乐,Stable Audio 2.0重磅发布!

Stable Audio 2.0发布:Stability.ai发布了音频模型Stable Audio 2.0,支持生成长达3分钟44.1 kHz的高质量音乐,超过谷歌和Meta的同类产品。新版本使用了Diff...