AI最新资讯

刚刚,GPT-4o关键人物离职创业!曾在OpenAI最早提出构建「Her」

Alexis Conneau 离职创业机器之心报道,OpenAI 音频 AGI 研究负责人 Alexis Conneau 宣布离职创业。Conneau 是 GPT-4o 项目的关键人物之一,也是 OpenAI 最早...

召唤100多位学者打分,斯坦福新研究:「AI科学家」创新确实强

斯坦福大学的研究团队通过对比实验发现,AI生成的科研思路在新颖度和激动人心方面显著优于人类专家。 该研究团队招募了104位NLP研究者,让他们提供创新研究想...

梯度下降是门手艺活

极市导读 梯度下降法是优化算法中的基础,它通过调整步长来寻找函数的最小值。本文通过具体例子探讨了梯度下降法中步长选择的重要性,并指出了步长设置不当...

ACM MM 2024|基于二维先验学习的三维人物交互重建

极市导读:本文提出了一种二维监督方法,从野外的二维图像中学习三维人体-物体空间关系的先验知识。摘要:本文介绍了一种从大规模二维图片中学习三维环境中人...

ECCV’24|直接生成 4K图像! PixArt-Σ:Weak-to-Strong 训练的 4K 高清文生图模型

PixArt-Σ是PixArt系列的最新力作,由华为诺亚方舟实验室、大连理工大学、香港大学和香港科技大学共同研发。该模型是一种Diffusion Transformer(DiT),能够...

表格增强生成TAG登场:解锁AI自然语言与数据库的完美结合

机器之心报道了一项由UC伯克利和斯坦福大学的研究人员共同开发的新方法——表格增强生成(TAG,Table-Augmented Generation),旨在解决自然语言处理(NLP)在...

还在人工炼丹?自动提示工程指南来了,还带从头实现

谷歌研究者Heiko Hotz近期发布了一篇关于自动提示词工程(APE)的详细介绍,这是一种自动生成和优化LLM提示词的技术,旨在提升模型在特定任务上的性能。APE的...

刚刚,苹果首款AI手机发布!A18芯片,新增拍照按钮,AirPods变助听器

iPhone 16标准版保留了60Hz的屏幕刷新率,但内存升级至8GB,并提供了多种存储容量选择。相机系统得到了显著提升,主摄像头支持4800万像素,具备传感器位移式...

Vec2Face: 首次!用合成的人脸数据集训练的识别模型性能高于真实数据集

极市导读 此工作提出的Vec2Face模型首次实现了从特征向量生成图片的功能,并且向量之间的关系,如相似度,和向量包含的信息,如ID和人脸属性,在生成的图片...

ACM MM’24|CPRFL:基于CLIP的新方案,破解长尾多标签分类难题

极市导读本文提出了一种新颖的提示学习方法,类别提示精炼特征学习(CPRFL),用于长尾多标签图像分类(LTMLC)。这是首次利用类别语义关联来缓解LTMLC中的头...