标签:GPU

AMD的GPU跑AI模型终于Yes了?PK英伟达H100不带怕的

在AMD与英伟达的长期竞争中,AI算力的对比一直是业界关注的焦点。尽管英伟达在AI训练领域占据领先地位,但AMD在内存和性价比方面展现出竞争力。近期,科技媒...

GPU推理时代终结?世界最大芯片加持推理狂飙20倍,英伟达H100也被干趴!

Cerebras Inference推理架构Cerebras Inference推理架构是Cerebras公司推出的一款高性能AI推理产品,其推理速度远超当前最先进的GPU,能够以1800 token/s的速...

对于GPU的未来,VC圈分裂了,a16z和红杉各站一边

风投巨头红杉资本和Andreessen Horowitz(a16z)在GPU未来需求问题上持有不同看法。a16z认为GPU供应短缺短期内不会缓解,正在积极投资AI初创企业并提供GPU租...

英伟达,遭遇反垄断调查

英伟达作为全球最大的人工智能和计算机图形芯片制造商,近期面临法国反垄断监管机构的指控,这将是首家对该芯片制造商采取行动的执法机构。去年9月,法国对显...

从零开始手搓GPU,照着英伟达CUDA来,只用两个星期

摘要:美国web3开发公司创始工程师Adam Majmudar分享了他从零开始构建GPU并成功的经历。Majmudar仅用两周时间完成了这一挑战,他的项目在GitHub上获得了5300...

只需百行代码,让H100提速30%,斯坦福开源全新AI加速框架

步骤2:撰写摘要总结斯坦福大学的研究者们在博客《GPUs Go Brrr》中探讨了如何提高GPU在AI计算中的利用率,并发布了一个名为ThunderKittens的库,旨在简化CUD...

英伟达AI Workbench正式发布,大幅度简化大模型开发流程

NVIDIA在官网宣布正式发布AI Workbench,这是一款面向AI大模型开发人员的工具包,旨在简化繁琐的部署和开发流程。AI Workbench支持快速的GPU环境设置,跨异构...

AI项目中GPU 利用率低,常见原因分析及优化

摘要:本文探讨了在训练模型时遇到的GPU利用率低的问题,并提供了详细的解决办法。首先,作者解释了GPU利用率的定义,即GPU在时间片上的利用率。接着,文章分...