标签:合成数据

CVPR 2024|仅用合成数据训练模型到底行不行?有新发现!

摘要:在机器学习领域,合成数据的使用越来越受到重视,尤其是在需要大量数据训练模型的场景中。最近的研究显示,使用合成数据训练的自监督和多模态模型在多...

关于post-training和一些思考

摘要:本文深入分析了大模型技术报告中的后训练(post-training)环节,特别是开源大模型Llama3.1的相关技术细节。文章首先指出,尽管学界普遍认为PPO(Proxima...

小模型站起来了,浏览器里跑出SOTA,抱抱脸:快逃,合成数据不是未来

摘要:抱抱脸公司(Hugging Face)开发了一种新的SOTA小模型,这些模型在不同的数据规模级别上取得了显著的胜利。该公司的首席科学家Thomas Wolf分享了开发这...

英伟达最新技术分享:手把手教你用Llama 3.1合成数据改进模型!附代码

英伟达在其技术博客中详细介绍了如何利用Llama 3.1模型生成合成数据,以支持领域模型或RAG系统的微调。合成数据在AI领域已有十多年的应用历史,但其重要性随...

英伟达开源最强通用模型Nemotron-4 340B

英伟达宣布推出Nemotron-4 340B,包含一系列开源模型,开发人员可以使用这些模型生成合成数据,用于训练大语言模型(LLM),适用于医疗健康、金融、制造、零...

OpenAI曾转录100万小时视频数据,训练GPT-4

文章首先介绍了AIGC领域的专业社区,关注微软、OpenAI、百度文心一言、讯飞星火等大语言模型的发展和应用落地。接着,文章提到纽约时报发布的一篇关于科技巨...

你的自拍和聊天记录,正被硅谷大厂砸数十亿美元疯抢!

随着2026年数据荒的临近,硅谷大厂们正争相购买可用于AI训练的数据资源。从社交媒体上的旧照片到聊天记录,这些曾被忽视的数据现在变得极其宝贵。科技巨头们...

CVPR 2024满分论文,英伟达开源BOP排行榜6D物体姿态第一名方法

方法介绍FoundationPose是一个统一的大模型,支持6D物体姿态估计和跟踪,适用于新颖物体。它通过神经隐式表示来弥合基于模型和无模型设置之间的差距,允许有...