CVPR 2024｜NAT其实真的不输扩散模型！AutoNAT：全新定制训练&生成策略拓宽性能边界

AI最新资讯2周前发布 tree

5 0 0

今日应用

TheFuture书籍搜索

TheFuture书籍搜索是为读书爱好者们打造的电子书搜索引擎，只需输入书名即可快速找到想看的书籍，让获取书籍变得简单快捷！让知识触手可及

今日话题

CVPR 2024｜NAT其实真的不输扩散模型！AutoNAT：全新定制训练&生成策略拓宽性能边界

重点标签 AutoNAT、图像生成、非自回归、NAT、优化策略

文章摘要

极市导读：本文提出了一种名为AutoNAT的新方法，旨在通过统一优化问题来自动设计训练和生成策略，以提高非自回归Transformer（NAT）在图像生成任务中的性能。

1. AutoNAT：重新思考图像生成中的非自回归建模
– 诞生背景：扩散模型在图像生成领域虽然成功，但计算成本高，需要更高效的替代方案。NAT作为一种高效方案，与扩散模型相比性能较差，主要原因在于训练和生成策略的设计。
– NAT方法简介：NAT通常与预训练的VQ-autoencoder结合使用，负责图像与latent视觉tokens之间的转换。训练策略基于掩码token建模目标函数，生成策略则涉及多步生成过程。
– AutoNAT方法：提出一种联合优化框架，通过交替优化生成策略和训练策略来提高NAT的性能。生成策略优化通过梯度下降解决，训练策略优化则采用Beta分布简化问题并使用Greedy Search。
– 实验结果：在ImageNet-256、ImageNet-512、MS-COCO和CC3M数据集上验证了AutoNAT的有效性。与现有方法相比，AutoNAT在生成质量和计算成本方面均表现出色。

总结：AutoNAT通过自动优化训练和生成策略，显著提高了NAT在图像生成任务中的性能，有望成为扩散模型的高效替代方案。

文章来源

原文地址: 点我阅读全文
原文作者: 极市平台

文章版权归作者所有，未经允许请勿转载。

暂无评论

暂无评论...

CVPR 2024｜NAT其实真的不输扩散模型！AutoNAT：全新定制训练&生成策略拓宽性能边界

今日应用

今日话题

文章摘要

文章来源

第一个100%开源的MoE大模型，7B的参数，1B的推理成本

ECCV'24｜ToCom：华为推出通用ViT标记压缩器，一次训练适配所有场景

相关文章

暂无评论

热门网址

热门标签