文章资讯

「音乐界Sora」Udio来了:前DeepMind员工创业,比Suno可定制性更强

Udio加入AI音乐生成竞争近日,音乐生成领域迎来了新玩家Udio,其产品可以通过人工输入的文本提示创建高保真音乐音频。Udio的风格多样,包括乡村音乐、理发店...

多篇顶会一作却申博失败?斯坦福博士生亲述:AI领域太卷

文章摘要:一位在多个顶级机器学习会议上发表论文的研究者,在申请博士项目时遭遇挫折。在Reddit社区上,许多用户分享了他们的看法,认为尽管申请竞争激烈的...

Grok多模态大模型Grok-1.5V来了!

研究人员为了提升模型对物理世界的理解,引入了RealWorldQA基准测试,旨在评估多模式模型对真实世界空间的基本理解能力。该基准测试包含超过700张图像,每张...

好奇心驱使的自动红队测试:MIT学者教你如何让大模型避免产生仇恨或有害的输出

研究人员使用强化学习来训练红队模型,利用好奇心驱动探索的技术。红队模型被激励于对其生成的每个提示的后果保持好奇心,因此会尝试具有不同单词、句子模式...

Zephyr 141B-A35B开源大模型发布,基于ORPO新技术

近日,Zephyr 141B-A35B大模型发布,其性能和效率方面确立了新的标杆。该模型是Mixtral-8x22B的继任者,采用了创新的Odds Ratio Preference Optimization (OR...

检索增强微调(RAFT)简介

本文介绍了一种名为检索增强微调(RAFT)的方法,它是针对大型语言模型(LLMs)的微调方法,旨在提高模型在特定领域内以“开放书本”设置回答问题的性能。开放...

OpenAI Sora最强竞争对手来了,Google DeepMind、TikTok等打造视频生成工具Haiper.ai,免费!

Haiper.ai 是一款新兴的免费 AI 视频生成工具,旨在探索通向通用人工智能(AGI)的新途径。该平台由 Google DeepMind、TikTok 和顶尖学术研究实验室的前员工...

性能超ChatGPT-3.5,专用金融分析的多模态大语言模型

研究人员来自不列颠哥伦比亚大学和Invertible AI联合推出了FinTral,一款专注于金融分析的大语言模型。FinTral不仅支持文本提示,还支持图表、图片的多模态专...

马斯克展示Grok-1.5 Vision:多模态,能理解真实世界

文章介绍了马斯克旗下的AI公司x.ai发布的Grok-1.5 Vision,这是一个具有视觉功能的AI模型,能够深度理解真实世界并进行数据解读和转换。与上一代相比,Grok-1...
18687888990119