失联大神李沐B站复更：领读Llama 3.1论文，还多讲了一点AI八卦；大模型竞技场Llama 3.1排名第三

AI最新资讯2个月前发布 tree

17 0 0

今日应用

口袋云盘搜索

各大盘资源免费搜网

今日话题

失联大神李沐 B站复更：领读Llama 3.1论文，还多讲了一点AI八卦；大模型竞技场Llama 3.1排名第三
失联大神李沐B站复更：领读Llama 3.1论文，还多讲了一点AI八卦；大模型竞技场Llama 3.1排名第三

重点标签 李沐、AI、Llama-3.1、B站、技术交流

文章摘要

AI领域知名专家李沐老师在时隔一年多后，于B站发布了新一期的“经典论文精读系列”，深入解读了Llama-3.1技术论文。视频中，李沐老师不仅详细介绍了Llama-3.1的技术细节，还透露了一些有趣的幕后故事。例如，Llama团队在训练最大模型时，最初同时尝试了MoE模型和稠密模型，但最终MoE模型未能成功，只发布了一个简化版本。

Llama-3.1-405B作为开源模型，在大模型竞技场排名中首次进入前三，仅次于GPT-4o和Claude-3.5-Sonnet。这一成绩在人类评估中与另外两个模型不相上下。此外，Llama-3.1-405B在单项排名中也表现优异，如编码、数学、指令遵循和硬提示等方面均位列前三。同时，Llama-3.1-70B也取得了总榜第9的好成绩，整体置信水平有了显著提升。

国外网友对Llama-3.1-405B的新成绩表示祝贺，并期待其下一次迭代将带来更大的惊喜。网友们已经开始尝试将Llama-3.1-405B应用于各种场景，如在树莓派上运行、创建GitHub仓库的聊天机器人等。尽管存在一些技术问题，但大家对尝试使用Llama-3.1-405B的热情不减。

李沐老师的Llama-3.1论文精读视频和相关榜单数据可在以下链接查看：
– 李沐Llama3.1论文精读：[https://www.bilibili.com/video/BV1WM4m1y7Uh/](https://www.bilibili.com/video/BV1WM4m1y7Uh/)
– 榜单完整数据：[https://chat.lmsys.org/?leaderboard](https://chat.lmsys.org/?leaderboard)

此外，极市平台还提供了多模态大模型解读、Tranformer系列、ICCV2023论文解读等技术专栏，以及Neural ODE、Transformer等技术综述，欢迎点击阅读原文进入CV社区，获取更多技术干货。

文章来源

原文地址: 点我阅读全文
原文作者: 极市平台

文章版权归作者所有，未经允许请勿转载。

暂无评论

暂无评论...

失联大神李沐B站复更：领读Llama 3.1论文，还多讲了一点AI八卦；大模型竞技场Llama 3.1排名第三

今日应用

今日话题

文章摘要

文章来源

CVPR 2024｜基于VR上半身稀疏信号的全身动作生成框架

性能秒杀SD3、DALL·E-3，开源文生图模型杀出大黑马

相关文章

暂无评论

热门网址

热门标签