华为诺亚开源GhostNetV3:传统小模型的新型优化策略

AI最新资讯5个月前发布 tree
81 0 0

今日应用


今日话题


华为诺亚开源GhostNetV3:传统小模型的新型优化策略
华为诺亚开源GhostNetV3:传统小模型的新型优化策略
 

重点标签 tag1华为诺亚方舟实验室tag2GhostNetV3tag3移动设备物联网设备tag4神经网络模型tag5ImageNet-1K数据集

文章摘要


摘要:
华为诺亚方舟实验室最近发布了一款名为GhostNetV3的新型神经网络模型,该模型在保持模型大小和推理速度的同时,显著提升了性能。在ImageNet-1K数据集上的实验结果显示,GhostNetV3 1.3×模型在仅使用269M FLOPs和14.46ms的移动设备延迟下,达到了79.1%的top-1准确率,超越了现有模型。该模型采用了创新的训练策略,包括重新参数化设计、知识蒸馏、训练策略优化等,以充分发挥轻量化模型的潜力。

详细内容:

1. 背景介绍:
移动设备物联网设备日益普及的今天,对高效、轻量化的神经网络模型的需求日益迫切。华为诺亚方舟实验室针对这一需求,发布了GhostNetV3模型。

2. 模型性能:
GhostNetV3在ImageNet-1K数据集上的实验结果显示,其1.3×模型在保持轻量化的同时,达到了与一些大型模型相当的性能。具体来说,该模型在该数据集上达到了79.1%的top-1准确率,同时保持了269M FLOPs和14.46ms的移动设备延迟。

3. 方法介绍:
重新参数化设计: GhostNetV3采用了训练时重参数化方法,通过使用深度可分离卷积和点群卷积提升模型的学习能力,同时不引入额外的推理阶段参数数量和计算复杂度。
知识蒸馏: 通过模仿教师模型的输出分布,鼓励小型模型学习到更丰富的特征表示,提升了模型的性能。
训练策略: 研究团队探索了适用于小模型的训练策略,包括不同的学习率及学习率衰减策略的组合,以及对轻量化模型更有效的数据增强方法。

4. 实验结果:
图像分类任务: GhostNetV3在ImageNet-1K数据集上的表现证明了其在保持轻量化的同时,能够达到与大型模型相当的性能。
目标检测任务: 在COCO数据集上,使用GhostNetV3作为骨干网络的检测模型,展现了GhostNetV3在目标检测任务上的优势。
消融实验: 研究团队进行了一系列的消融实验,验证了各个训练策略对模型性能的影响。

5. 结论:
GhostNetV3通过一系列创新的训练策略,在保持模型轻量化的同时,显著提升了模型的性能。这些策略不仅适用于GhostNetV3本身,还可以推广到其他轻量化模型的训练中。

6. 资源获取:
公众号后台回复“数据集”获取100+深度学习各方向资源整理。

7. 极市平台推荐:
– 技术专栏:多模态大模型超详细解读专栏、搞懂Tranformer系列、ICCV2023论文解读、极市直播。
– 极视角动态:欢迎高校师生申报极视角2023年教育部产学合作协同育人项目,新视野+智慧脑,「无人机+AI」成为道路智能巡检好帮手。
– 技术综述:四万字详解Neural ODE、transformer的细节到底是怎么样的?Transformer 连环18问。

文章来源


原文地址: 点我阅读全文
原文作者: 极市平台

© 版权声明

相关文章

暂无评论

暂无评论...