今日应用
今日话题
图像生成开源数据集资源汇总
重点标签 MetFaces、FFHQ、Oxford 102 Flower、CelebAMask-HQ、WHOOPS!、Cityscapes 数据集、深度学习资源
文章摘要
本文介绍了多个用于深度学习的数据集,包括人脸图像、花卉分类、人脸解析、常识推理挑战以及城市景观的语义分割。以下是对这些数据集的详细摘要:
1. MetFaces – 包含1336张1024×1024分辨率的高质量PNG人脸图像,通过大都会艺术博物馆收藏API下载并使用dlib自动对齐和裁剪。
2. Flickr-Faces-HQ Dataset (FFHQ) – 包含70,000张同样分辨率的高质量PNG图像,具有年龄、种族和背景的多样性,以及对配饰的良好覆盖,图片从Flickr抓取并使用dlib自动对齐和裁剪。
3. Oxford 102 Flower – 一个包含102个花卉类别的图像分类数据集,每个类别包含40至258张图像,展现了比例、姿势和光线的多样性。
4. CelebAMask-HQ – 一个大规模人脸图像数据集,包含30,000张高分辨率人脸图像,每张图像都有对应的面部属性分割掩码,掩码手工注释,尺寸为512 x 512,涵盖19种面部成分和配件。
5. WHOOPS! – 包含500张合成图像和10,874个注释,旨在挑战AI模型对常识和组合特性的推理能力,使用文本到图像模型生成图像。
6. Cityscapes – 城市景观数据集,包含从德国驾驶车辆拍摄的标记视频的静止图像,用于语义分割任务,包含2975个训练图像文件和500个验证图像文件。
此外,文章还提供了技术专栏链接,如多模态大模型解读、Tranformer系列、ICCV2023论文解读等,以及极市平台的动态更新和资源整理信息。
文章来源
原文地址: 点我阅读全文
原文作者: 极市平台