AI最新资讯

美国发布新拟议规则,禁止在中国投资AI、半导体、量子计算

美国财政部官网于6月22日发布了一项提案通知(NPRM),旨在执行拜登总统于2023年8月9日签署的第14105号行政命令——境外投资令。这项提案通知是在财政部去年8月...

Is Scaling All You Need? LLM收益递减,AI小厂难活命

近日,马库斯的一句「Is scaling all you need?」引发了正反两方的论战。自GPT-4发布以来,尽管有约500亿美元投资在芯片上,但至今仍无模型能超越GPT-4,引发...

对吴恩达 workflow 概念产品化的思考

本文深入探讨了workflow类型产品在当前设计和应用中存在的问题,并提出了一套基于形式化表达的产品设计方法论。文章首先指出了workflow产品在现实应用中的局...

DiG:使用门控线性注意力机制的高效可扩展 Diffusion Transformer

本文介绍了一种新型的扩散模型——DiG(Diffusion Gated Linear Attention Transformers),由华中科技大学和字节跳动的研究团队共同开发。DiG模型通过引入门控...

CVPR2024|vivo提出使用对抗微调获得泛化性更强的SAM,分割直接登顶 SOTA!

本文介绍了一种名为ASAM(Adversarial Sample-based Adversarial Model)的新方法,旨在通过对抗微调来增强现有的Segment Anything Model(SAM)在图像分割任...

《Python 机器学习》作者新作:从头开始构建大型语言模型,代码已开源

步骤2:撰写摘要Sebastian Raschka,一位知名的机器学习和人工智能研究员,以及畅销书《Python 机器学习》的作者,最近发布了一本新书《Build a Large Langua...

华为盘古大模型5.0技术解密:更多模态,复杂推理

在技术层面,华为对盘古3.0进行了全面升级,提高了训练效率,并从数据、参数和算力三个方面介绍了大模型的训练过程。数据合成技术通过weak2strong方法,迭代...

墙裂推荐!Karpathy大模型培训课LLM101n上线了,非常基础

Andrej Karpathy 最近在 GitHub 上上传了一个名为 'LLM101n' 的课程项目,该项目旨在教授如何构建一个能够创作、提炼和阐释小故事的大型语言模型(LLM),即 ...

导师爆料:这篇CVPR最佳学生论文,从想法到成稿只用一个月,源自业余灵感

在2024年的CVPR会议上,最佳学生论文奖授予了Zehao Yu等人撰写的论文《Mip-Splatting: Alias-free 3D Gaussian Splatting》,这项研究展示了一种创新的3D图像...

OpenAI收购Rockset,增强ChatGPT等数据搜索功能

OpenAI于6月22日宣布收购实时搜索和数据分析公司Rockset,旨在通过整合Rockset的技术和产品,加强ChatGPT的搜索和数据分析功能,为企业和用户提供更高效的数...
14243444546114