文章资讯
股价飙升260%,市值冲击2.2万亿,老黄祭出新核弹B200!AI迎新摩尔时代!
在最近结束的GTC人工智能大会上,英伟达推出了其新一代性能巨兽——Blackwell B200 GPU和GB200超级芯片。这款新芯片被命名为Blackwell,以纪念著名数学家David ...
大模型能否通往AGI
张奇教授在科技慢半拍播客节目中,深入探讨了大规模语言模型和人工通用智能(AGI)的当前发展和未来前景。他强调了科研人员在变革时代中应持有的客观、理性态...
英伟达推出NIM,可优化推理以实现大规模AI模型部署
本文介绍了AIGC领域的专业社区,关注大语言模型(LLM)的发展和应用落地,以及NVIDIA NIM的推出。NVIDIA NIM是一组云原生微服务,旨在简化在不同平台上部署生...
3140亿参数,可商用!马斯克开源大模型Grok-1
Grok-1开源与性能介绍:专注AIGC领域的专业社区,本文介绍了马斯克旗下公司x.ai开源的大模型Grok-1。Grok-1是一款类ChatGPT的混合专家模型,具有3140亿参数,...
英伟达发布GB200 NVL72,将万亿参数大模型推理效率提升30倍
在2024年的GTC大会上,英伟达发布了专为万亿参数大模型训练和推理设计的新一代AI专用GPU——GB200 NVL72。这款产品在处理大模型时,如MoE(专家混合模型),能...
专访CeMeta森宇宙 | 首个面向家电家居行业营销领域的AI大模型
CeMeta森宇宙还推出了三款基于森罗万象大模型的AI营销产品,包括来客易AI全民营销助手、森易销AI电商运营助手和森生万物AI营销内容中台,这些产品旨在解决家...
如何把大量物理知识塞给AI?EIT和北大团队提出「规则重要性」概念
深度学习模型通过从大量数据中学习潜在关系,已在科学研究领域取得显著进展。然而,这些模型存在局限性,如过度依赖数据、泛化能力受限,以及与物理现实的一...
拖拽P图技术又升级了:StableDrag更稳、更准,南大、腾讯联合打造
StableDrag:更稳定的图像拖拽编辑框架南京大学和腾讯的研究者最近提出了一种新的图像编辑框架——StableDrag,旨在提供更稳定和精确的拖拽编辑体验。该框架通...
ICLR 2024 | 无需训练,Fast-DetectGPT让文本检测速度提升340倍
Fast-DetectGPT 是一种新的文本检测方法,它能够在无需训练的情况下,使用开源小语言模型来检测大语言模型如 ChatGPT 和 GPT-4 生成的文本内容。该方法提高了...
没等来OpenAI,等来了Open-Sora全面开源
Open-Sora 1.0是由Colossal-AI团队全面开源的全球首个类Sora架构视频生成模型。该模型包括整个训练流程、数据处理、所有训练细节和模型权重,旨在与全球AI爱...