文章资讯

谷歌发布Veo:文生超1分钟、1080P视频,媲美Sora

此外,谷歌还发布了多款产品,包括更轻量的大模型Gemini 1.5 Flash、增强版的Gemini 1.5 Pro、第六代AI处理器TPU-Trillium、最新的文生图模型Imagen 3、音乐...

快速提升性能,如何更好地使用GPU(上)

摘要:本文主要探讨了在GPU成本上升和供应短缺的背景下,如何更有效地使用GPU以提升其性能。文章提出了三个关键点:让GPU保持忙碌、充分利用GPU中的所有资源...

CLIP-Mamba:首次提出用CLIP训练Mamba,仅用1/5参数就达到ViT天花板性能

摘要:本文介绍了利用对比语言-图像预训练(CLIP)训练的Mamba模型,并在26个零样本分类数据集和16个分布外(OOD)数据集上进行了评估。研究发现,6700万参数...

大模型思维链(Chain-of-Thought)技术原理

极市导读:本文详细介绍了思维链(Chain-of-Thought,CoT)技术及其在大语言模型中的应用和改进。文章首先回顾了提示学习(prompt learning)的背景,然后深...

微软让MoE长出多个头,大幅提升专家激活率

步骤2:撰写摘要近日,微软研究院和清华大学提出了一种新的模型——多头混合专家(MH-MoE),旨在解决现有混合专家模型中的一些问题。混合专家(MoE)是一种支...

零一万物Yi-1.5来了,国产开源大模型排行榜再次刷新

步骤2:撰写摘要总结近日,中国大模型公司零一万物在OpenAI发布会前夕,开源了其Yi大模型家族的新成员——Yi-1.5模型。该模型包括6B、9B、34B三个版本,采用Apa...

OpenAI颠覆世界:GPT-4o完全免费,实时语音视频交互震撼全场,直接进入科幻时代

步骤2:撰写摘要OpenAI 在其首次春季新品发布会上推出了具有革命性的 AI 模型 GPT-4o,以及桌面应用程序,展示了其在文本、音频和图像处理上的新能力。这一技...

Hello,贾维斯!Hello,GPT-4o!

摘要:OpenAI发布了其新旗舰模型GPT-4o,这是一个能够实时处理音频、视觉和文本输入并生成相应输出的全能模型。GPT-4o在人机交互方面迈出了重要一步,其响应...

OpenAI一夜改写历史,GPT-4o干翻所有语音助手!丝滑如真人引爆全网科幻成真

步骤2:撰写详细摘要OpenAI在一次备受瞩目的发布会上宣布了其最新产品GPT-4o的问世,这一消息震惊了在场的所有观众。GPT-4o的发布标志着人机交互进入了一个新...

微软宣布GPT-4o模型,可在 Azure OpenAI上使用

微软宣布其与OpenAI合作开发的多模态模型GPT-4o已在Azure OpenAI云服务中可用。GPT-4o能够进行跨文本、视频、音频的多模态推理,如辅导孩子解答数学题或进行...
16869707172119