CVPR 2024|NAT其实真的不输扩散模型!AutoNAT:全新定制训练&生成策略拓宽性能边界

今日应用


今日话题


CVPR 2024|NAT其实真的不输扩散模型!AutoNAT:全新定制训练&生成策略拓宽性能边界
CVPR 2024|NAT其实真的不输扩散模型!AutoNAT:全新定制训练&生成策略拓宽性能边界
 

重点标签 AutoNAT图像生成非自回归NAT优化策略

文章摘要


极市导读:本文提出了一种名为AutoNAT的新方法,旨在通过统一优化问题来自动设计训练和生成策略,以提高非自回归Transformer(NAT)在图像生成任务中的性能。

1. AutoNAT:重新思考图像生成中的非自回归建模
诞生背景:扩散模型在图像生成领域虽然成功,但计算成本高,需要更高效的替代方案。NAT作为一种高效方案,与扩散模型相比性能较差,主要原因在于训练和生成策略的设计。
NAT方法简介:NAT通常与预训练的VQ-autoencoder结合使用,负责图像与latent视觉tokens之间的转换。训练策略基于掩码token建模目标函数,生成策略则涉及多步生成过程。
AutoNAT方法:提出一种联合优化框架,通过交替优化生成策略和训练策略来提高NAT的性能。生成策略优化通过梯度下降解决,训练策略优化则采用Beta分布简化问题并使用Greedy Search。
实验结果:在ImageNet-256、ImageNet-512、MS-COCO和CC3M数据集上验证了AutoNAT的有效性。与现有方法相比,AutoNAT在生成质量和计算成本方面均表现出色。

总结:AutoNAT通过自动优化训练和生成策略,显著提高了NAT在图像生成任务中的性能,有望成为扩散模型的高效替代方案。

文章来源


原文地址: 点我阅读全文
原文作者: 极市平台

© 版权声明

相关文章

暂无评论

暂无评论...