AI最新资讯

Karpathy观点惹争议：RLHF不是真正的强化学习，谷歌、Meta下场反对

尽管如此，Karpathy也承认RLHF在构建LLM助手方面具有其独特价值，尤其是在利用人类监督的“容易度”差距方面。其他专家，如谷歌研究科学家Kevin Patrick Murphy...

1个月前

DeepMind公司开发了一款能够与人类业余选手相媲美的乒乓球机器人智能体，这一成果在巴黎奥运会期间引起了广泛关注。这款机器人智能体通过学习型的方式，掌握...

1个月前

上海科技大学MARS实验室团队在SIGGRAPH 2024大会上获得两篇最佳论文荣誉提名上海科技大学MARS实验室团队在SIGGRAPH 2024大会上获得两篇最佳论文荣誉提名，其...

1个月前

本文介绍了一种新型的全图卷积模型GKGNet，它针对多标签图像识别任务，首次研究了视觉特征和标签嵌入的统一图表示。GKGNet通过灵活的图结构有效地处理了目标...

1个月前

本文介绍了Lumina-mGPT，一个多模态自回归模型家族，它能够执行各种视觉和语言任务，特别是在从文本描述生成逼真图像方面表现出色。Lumina-mGPT模型基于大规...

1个月前

在大模型训练过程中，软硬件故障频发，Checkpoint系统作为关键技术，负责模型状态的存储与恢复，以提高训练效率。字节跳动豆包大模型团队与香港大学联合开发...

1个月前

AI技术在编程领域的应用日益广泛，AI代码助手正逐渐成为架构师的得力助手。随着人工智能技术的不断进步，AI在编程领域的应用也越来越广泛。AI代码助手不仅能...

1个月前

在本文中，作者提出了一种新的自回归图像生成模型，该模型通过使用扩散模型来建模图像词元的分布，从而提高了生成能力。自回归模型在自然语言处理（NLP）中取...

1个月前

EditRetro 模型通过其非自回归解码器提高了生成效率，能够在每个解码器内并行执行编辑操作。当给定一个目标分子时，编码器将其字符串作为输入并生成相应的隐...

1个月前

Sakana AI公司近期发表的论文《Transformer Layers as Painters》深入探讨了预训练Transformer模型中的信息流，并通过一系列实验，对仅解码器和仅编码器冻结...

1个月前