AI最新资讯

Llama也能做图像生成?文生图模型已开源

极市导读:最近,香港大学和字节跳动共同提出了一种名为LlamaGen的图像生成模型,该模型基于自回归模型LLama,首次在ImageNet benchmark上超越了LDM、DiT等扩...

分布式深度学习框架的前世今生,从 MapReduce 到 Pathways

分布式深度学习框架的发展历程主要围绕解决超大模型的训练问题,针对具有超大规模密集参数和稀疏参数的模型。从早期的MPI、Hadoop到Spark,再到参数服务器(P...

30倍于传统方法,中国科学院团队Transformer深度学习模型预测糖-蛋白质作用位点

摘要:糖类是自然界中最丰富的有机物质,对生命至关重要。然而,糖类分子的多样性和复杂性,对实验识别糖-蛋白质结合以及相互作用的位点提出了挑战。中国科学...

Nature 热议论文证明「语言不是思考工具」,LLM 可能要学不会推理了?

本期机器之心PRO会员通讯关注了三个AI与机器人领域的热点问题。首先,MIT和UC伯克利的研究者在《Nature》上发表的论文《Language is primarily a tool for co...

从零开始,用英伟达T4、A10训练小型文生视频模型,几小时搞定

摘要:- 文章是关于构建文本生成视频模型的教程,使用GAN架构。- 作者没有大算力GPU,因此选择编写小规模架构。- 推荐使用Colab或Kaggle的T4 GPU进行高效训练...

Sora强敌来啦!Runway的 Gen-3 Alpha开启测试

Runway公司于6月29日宣布,其最新产品Gen-3 Alpha视频平台已向部分用户开放测试。这款产品在视觉质量、构图、文本语义还原、物理模拟和动作连贯性等方面相较...

AI小分子药物发现的「百科全书」,康奈尔、剑桥、EPFL等研究者综述登Nature子刊

生成性分子设计任务可以分为分布学习和目标导向生成,包括条件生成和分子优化。分布学习通过建模分子的概率分布来采样新分子,而条件生成则根据特定属性、子...

看张手绘草图就能合成图形程序,加州伯克利让扩散模型掌握新技能

加州大学伯克利分校的研究团队提出了一种新的程序合成方法,利用神经扩散模型直接操作句法树。这种方法通过迭代优化程序并确保句法有效性,同时允许模型观察...

开发者狂喜!Meta最新发布的LLM Compiler,实现77%自动调优效率

Meta公司近期推出了一项创新的人工智能技术——LLM Compiler,旨在帮助程序员更高效地编写代码。这一开源模型通过优化代码,有潜力彻底改变编译器的设计。在自...

谷歌、Anthropic推出创新神经压缩Equal-Info Windows

研究人员联合谷歌DeepMind和Anthropic推出了一种创新的神经压缩方法——Equal-Info Windows,旨在解决大语言模型(LLM)如ChatGPT、Gemini、Claude等在训练和推...
13536373839114