AI最新资讯

用最直观的动画,讲解LLM如何存储事实,3Blue1Brown的这个视频又火了

大型语言模型(LLM)能够预测与特定个人相关的知识,如迈克尔・乔丹与篮球的关系。3Blue1Brown 的《深度学习》课程第 7 课通过动画展示了 LLM 存储事实的方式...

全球3.5亿下载量破纪录! Llama家族暴涨10倍,开源帝国掀AI革命

Llama模型自诞生一年半以来,已经成为开源界的领军者,全球下载量接近3.5亿,是去年同期的10倍。这一成就得益于其在Hugging Face平台的广泛传播。Groq公司创...

实践教程|PyTorch与torch-xla的桥接

极市导读:文章从XLATensor开始的溯源、注册PyTorch库实现、从PyTorch调用到torch_xla三个方面来介绍PyTorch与torch-xla的桥接。前言:XLA (Accelerated Line...

ECCV 2024|R-Adapter:零样本模型微调新突破,提升鲁棒性与泛化能力

本文介绍了一种名为Robust Adapter(R-Adapter)的新型微调方法,旨在提高零样本模型在下游任务中的泛化能力和效率。R-Adapter通过在预训练模型中集成轻量级...

对比学习在学啥?

极市导读 在不使用任何假设的情况下,刻画出对比学习与谱聚类算法的等价关系。 >>[][加入极市CV技术交流群,走在计算机视觉的最前沿]对比学习是大模型的入门...

再见,AnandTech:著名科技网站宣布结束运营

在科技新闻界具有重要影响力的老牌硬件科技网站AnandTech宣布关闭,这一消息在互联网上引起了震动。AnandTech以其深入的硬件评论和分析赢得了硬件爱好者的忠...

Mamba作者新作:将Llama3蒸馏成混合线性 RNN

在深度学习领域,Transformer 模型因其注意力机制而广受欢迎,该机制允许模型关注输入序列的相关部分,从而实现更好的上下文理解。然而,注意力机制的计算开...

谷歌推世界首个AI游戏引擎,2000亿游戏产业恐颠覆!0代码生成游戏,老黄预言成真

摘要:极市导读:谷歌研究者开发的GameNGen,作为世界上首个完全由AI驱动的游戏引擎,能够以每秒20帧的速度实时生成逼真的DOOM游戏画面,这一技术突破预示着...

IJCAI 2024|首个视频人脸修复技术!让人脸细节更清晰!

极市导读:PGTFormer是首个专门为视频人脸恢复设计的方法,采用端到端的设计,摒弃了传统方法中的复杂对齐步骤,实现了更加高效和连贯的视频人脸恢复。方法介...

ECCV2024|扩散模型的反馈学习 | RFNet:利用人类反馈生成可靠的高质量图像

极市导读: 本文介绍了一种名为RFNet的多模态可靠反馈网络,旨在提升电商领域广告图像的生成质量和可用率。京东广告团队通过模拟人类审核AI图片的方式,利用R...
17891011114