AAAI 2024｜DSCL：已开源，北京大学提出解耦对比损失

今日应用

度加创作工具是一个百度出品的、人人可用的AIGC创作平台。度加致力于通过AI能力降低内容生成门槛，提升创作效率，一站式聚合百度AIGC能力，引领跨时代的内容生产方式。度加的主要功能包括AI成片（图文成片/文字成片）、AI数字人等。自2022年3月百家号开放内测以来，一年时间共计超过45万+百度创作者使用AIGC技术能力，创作700万篇+作品，百度累计分发量超过200亿+。

今日话题

AAAI 2024｜DSCL：已开源，北京大学提出解耦对比损失

重点标签 监督对比损失、SCL、长尾识别、类内距离、类间距离

文章摘要

摘要：
在视觉识别任务中，训练样本往往呈现长尾分布，这给识别带来了挑战。监督对比损失（SCL）在平衡数据集上表现良好，但在长尾识别中存在问题。本文提出了解耦监督对比损失（DSCL）和基于图像块的自蒸馏（PBSD）两种方法来解决这些问题。DSCL通过解耦两种正样本并重新制定类内距离的优化策略来减轻数据集不平衡的影响。PBSD则利用头类的知识来促进尾类中的表征学习，通过挖掘不同类之间的共享视觉模式来优化类间距离。实验结果表明，所提出的方法能够有效提高尾部类别的检索性能。

分析：
论文分析了SCL在长尾识别中的三个问题：对头类训练的过度关注、原样本和增强样本之间梯度的差异，以及对负样本处理的不足。针对这些问题，DSCL解耦了两种正样本，并添加了不同的权重，以实现更平衡的类内距离优化。PBSD则通过自蒸馏策略，利用头类和尾类之间的共享视觉模式来帮助尾类的学习。

方法：
DSCL的公式如下：
\[ \mathcal{L}_{DSCL} = -\sum_{i=1}^{2}\frac{1}{N_i}\sum_{j=1}^{N_i}\log\frac{e^{s_{ij}}/{\tau}}{1+e^{s_{ij}}/{\tau}} \]
其中，\( s_{ij} \) 表示正样本对的相似度，\( N_i \) 是正样本的数量，\( \tau \) 是温度参数。

PBSD的损失函数如下：
\[ \mathcal{L}_{PBSD} = -\sum_{k=1}^{K}\log\frac{e^{d_k}}{\sum_{l=1}^{L}e^{d_l}} \]
其中，\( d_k \) 表示基于块的特征和实例级特征之间的相似度。

实验：
实验结果表明，DSCL和PBSD的结合能够有效提高长尾识别的性能。在ImageNet-LT数据集上，使用DSCL和PBSD的方法将性能从57.7%提高到56.1%。此外，通过对比实验，证明了PBSD比传统的多作物（Multi-crop）策略更有效。

结论：
本文提出的DSCL和PBSD方法通过解耦正样本和利用共享视觉模式，有效地解决了长尾识别中的挑战，提高了尾部类别的检索性能。这些方法可以广泛应用于需要处理长尾分布数据的视觉识别任务中。

文章来源

原文地址: 点我阅读全文
原文作者: 极市平台

文章版权归作者所有，未经允许请勿转载。

暂无评论

暂无评论...

AAAI 2024｜DSCL：已开源，北京大学提出解耦对比损失

今日应用

今日话题

文章摘要

文章来源

奥特曼「草莓」模型跳票，OpenAI凌晨大新闻，把网友整懵了

MICCAI 2024｜即插即用！SelfReg-UNet：用于医学图像分割的自正则化 UNet

相关文章

暂无评论

热门网址

热门标签