从量子力学跨界来接替扩散模型?简化扩散薛定谔桥(S-DSB):能够在任意两个分布之间进行双向生成!

AI最新资讯4个月前发布 tree
48 0 0

今日应用


今日话题


从量子力学跨界来接替扩散模型?简化扩散薛定谔桥(S-DSB):能够在任意两个分布之间进行双向生成!
从量子力学跨界来接替扩散模型?简化扩散薛定谔桥(S-DSB):能够在任意两个分布之间进行双向生成!
 

重点标签 S-DSB扩散薛定谔桥SGM生成模型计算机视觉

文章摘要


步骤2:撰写详细摘要
S-DSB(简化扩散薛定谔桥)是一种针对扩散薛定谔桥(DSB)收敛慢和训练难问题进行改进的生成模型。它通过简化DSB的loss函数、将SGM(基于分数的生成模型)适配到DSB框架,并提出两种重参数化方式来实现改进。S-DSB的目标是计算任意两个可采样分布之间的最优传输,具有双向生成的能力,且天生适合条件生成任务。

DSB(扩散薛定谔桥)是一个跨界概念,源自量子力学的薛定谔方程,用于解决最优传输问题。DSB不需要将分布限制为特定形式,能够实现任意两个分布之间的转换。DSB的训练过程采用迭代优化方法,通过优化相邻时间步之间的条件分布来近似求解。

S-DSB的提出基于对SGM和DSB的问题分析,解决了SGM的加噪方案设计困难、先验分布限制问题,以及DSB的收敛慢、训练难、资源要求高等问题。S-DSB的训练方式仍属于IPF(迭代比例拟合)框架,通过交替训练两个模型来实现。

S-DSB的重参数化技巧包括Terminal Reparameterized DSB(TR-DSB)和Flow Reparameterized DSB(FR-DSB),旨在降低模型训练难度,使模型在不同时间步拥有一致的target。此外,S-DSB的训练框架与DSB共享,只是在训练目标和加噪方式上存在差异。

作者还探讨了生成模型的通用训练框架,指出大部分生成模型实际共享同一套训练逻辑,只是在训练目标和加噪方式上有所不同。最后,文章提供了从零开始实现S-DSB的代码示例,包括noise schedule的实现、DSB建模、神经网络、数据集和训练pipeline的详细说明。

文章来源


原文地址: 点我阅读全文
原文作者: 极市平台

© 版权声明

相关文章

暂无评论

暂无评论...