失联大神李沐B站复更:领读Llama 3.1论文,还多讲了一点AI八卦;大模型竞技场Llama 3.1排名第三

AI最新资讯2个月前发布 tree
17 0 0

今日应用


今日话题


失联大神李沐B站复更:领读Llama 3.1论文,还多讲了一点AI八卦;大模型竞技场Llama 3.1排名第三
失联大神李沐B站复更:领读Llama 3.1论文,还多讲了一点AI八卦;大模型竞技场Llama 3.1排名第三
 

重点标签 李沐AILlama-3.1B站技术交流

文章摘要


AI领域知名专家李沐老师在时隔一年多后,于B站发布了新一期的“经典论文精读系列”,深入解读了Llama-3.1技术论文。视频中,李沐老师不仅详细介绍了Llama-3.1的技术细节,还透露了一些有趣的幕后故事。例如,Llama团队在训练最大模型时,最初同时尝试了MoE模型和稠密模型,但最终MoE模型未能成功,只发布了一个简化版本。

Llama-3.1-405B作为开源模型,在大模型竞技场排名中首次进入前三,仅次于GPT-4o和Claude-3.5-Sonnet。这一成绩在人类评估中与另外两个模型不相上下。此外,Llama-3.1-405B在单项排名中也表现优异,如编码、数学、指令遵循和硬提示等方面均位列前三。同时,Llama-3.1-70B也取得了总榜第9的好成绩,整体置信水平有了显著提升。

国外网友对Llama-3.1-405B的新成绩表示祝贺,并期待其下一次迭代将带来更大的惊喜。网友们已经开始尝试将Llama-3.1-405B应用于各种场景,如在树莓派上运行、创建GitHub仓库的聊天机器人等。尽管存在一些技术问题,但大家对尝试使用Llama-3.1-405B的热情不减。

李沐老师的Llama-3.1论文精读视频和相关榜单数据可在以下链接查看:
– 李沐Llama3.1论文精读:[https://www.bilibili.com/video/BV1WM4m1y7Uh/](https://www.bilibili.com/video/BV1WM4m1y7Uh/)
– 榜单完整数据:[https://chat.lmsys.org/?leaderboard](https://chat.lmsys.org/?leaderboard)

此外,极市平台还提供了多模态大模型解读、Tranformer系列、ICCV2023论文解读等技术专栏,以及Neural ODE、Transformer等技术综述,欢迎点击阅读原文进入CV社区,获取更多技术干货。

文章来源


原文地址: 点我阅读全文
原文作者: 极市平台

© 版权声明

相关文章

暂无评论

暂无评论...