AI最新资讯

Karpathy观点惹争议:RLHF不是真正的强化学习,谷歌、Meta下场反对

尽管如此,Karpathy也承认RLHF在构建LLM助手方面具有其独特价值,尤其是在利用人类监督的“容易度”差距方面。其他专家,如谷歌研究科学家Kevin Patrick Murphy...

DeepMind机器人打乒乓球,正手、反手溜到飞起,全胜人类初学者

DeepMind公司开发了一款能够与人类业余选手相媲美的乒乓球机器人智能体,这一成果在巴黎奥运会期间引起了广泛关注。这款机器人智能体通过学习型的方式,掌握...

两篇论文同时获最佳论文荣誉提名,SIGGRAPH上首个Real-Time Live的中国团队用生成式AI创建3D世界

上海科技大学MARS实验室团队在SIGGRAPH 2024大会上获得两篇最佳论文荣誉提名上海科技大学MARS实验室团队在SIGGRAPH 2024大会上获得两篇最佳论文荣誉提名,其...

ECCV 2024|GKGNet:多标签分类遇上图卷积网络ViG

本文介绍了一种新型的全图卷积模型GKGNet,它针对多标签图像识别任务,首次研究了视觉特征和标签嵌入的统一图表示。GKGNet通过灵活的图结构有效地处理了目标...

视觉全能!自回归要反超扩散?Lumina-mGPT:任意分辨率丝滑逼真图像生成(上海AI Lab)

本文介绍了Lumina-mGPT,一个多模态自回归模型家族,它能够执行各种视觉和语言任务,特别是在从文本描述生成逼真图像方面表现出色。Lumina-mGPT模型基于大规...

Llama3训练每3小时崩一次?豆包大模型、港大团队为脆皮万卡训练提效

在大模型训练过程中,软硬件故障频发,Checkpoint系统作为关键技术,负责模型状态的存储与恢复,以提高训练效率。字节跳动豆包大模型团队与香港大学联合开发...

入职一年半,这个AI员工晋升为了国内首位AI架构师

AI技术在编程领域的应用日益广泛,AI代码助手正逐渐成为架构师的得力助手。随着人工智能技术的不断进步,AI在编程领域的应用也越来越广泛。AI代码助手不仅能...

深度解读何恺明团队新作:不用向量离散化的自回归图像生成

在本文中,作者提出了一种新的自回归图像生成模型,该模型通过使用扩散模型来建模图像词元的分布,从而提高了生成能力。自回归模型在自然语言处理(NLP)中取...

准确率达60.8%,浙大基于Transformer的化学逆合成预测模型,登Nature子刊

EditRetro 模型通过其非自回归解码器提高了生成效率,能够在每个解码器内并行执行编辑操作。当给定一个目标分子时,编码器将其字符串作为输入并生成相应的隐...

八问八答搞懂Transformer内部运作原理

Sakana AI公司近期发表的论文《Transformer Layers as Painters》深入探讨了预训练Transformer模型中的信息流,并通过一系列实验,对仅解码器和仅编码器冻结...
11718192021114