AI最新资讯

Llama也能做图像生成？文生图模型已开源

极市导读：最近，香港大学和字节跳动共同提出了一种名为LlamaGen的图像生成模型，该模型基于自回归模型LLama，首次在ImageNet benchmark上超越了LDM、DiT等扩...

3个月前

分布式深度学习框架的发展历程主要围绕解决超大模型的训练问题，针对具有超大规模密集参数和稀疏参数的模型。从早期的MPI、Hadoop到Spark，再到参数服务器（P...

3个月前

摘要：糖类是自然界中最丰富的有机物质，对生命至关重要。然而，糖类分子的多样性和复杂性，对实验识别糖-蛋白质结合以及相互作用的位点提出了挑战。中国科学...

3个月前

本期机器之心PRO会员通讯关注了三个AI与机器人领域的热点问题。首先，MIT和UC伯克利的研究者在《Nature》上发表的论文《Language is primarily a tool for co...

3个月前

摘要：- 文章是关于构建文本生成视频模型的教程，使用GAN架构。- 作者没有大算力GPU，因此选择编写小规模架构。- 推荐使用Colab或Kaggle的T4 GPU进行高效训练...

3个月前

Runway公司于6月29日宣布，其最新产品Gen-3 Alpha视频平台已向部分用户开放测试。这款产品在视觉质量、构图、文本语义还原、物理模拟和动作连贯性等方面相较...

3个月前

生成性分子设计任务可以分为分布学习和目标导向生成，包括条件生成和分子优化。分布学习通过建模分子的概率分布来采样新分子，而条件生成则根据特定属性、子...

3个月前

加州大学伯克利分校的研究团队提出了一种新的程序合成方法，利用神经扩散模型直接操作句法树。这种方法通过迭代优化程序并确保句法有效性，同时允许模型观察...

3个月前

Meta公司近期推出了一项创新的人工智能技术——LLM Compiler，旨在帮助程序员更高效地编写代码。这一开源模型通过优化代码，有潜力彻底改变编译器的设计。在自...

3个月前

研究人员联合谷歌DeepMind和Anthropic推出了一种创新的神经压缩方法——Equal-Info Windows，旨在解决大语言模型（LLM）如ChatGPT、Gemini、Claude等在训练和推...

3个月前