标签:tag1

万字长文带你梳理Llama开源家族:从Llama-1到Llama-3

摘要:本文详细介绍了Meta公司发布的Llama系列模型的演进历程、模型架构、训练数据、训练方法、效果对比、社区影响以及总结。Llama模型的发布对全球AI领域产...

极市直播回放第129期丨CVPR2024 Highlight:无参数无训练的网络也能进行3D表征学习吗?

摘要:本次分享邀请了香港城市大学在读博士朱向阳,他详细介绍了他们中稿CVPR2024的工作:'No Time to Train: Empowering Non-Parametric Networks for Few-s...

旅行者1号「复活」:世界最慢的电脑,被成功修复了

摘要:- 旅行者1号修复成功:在经历五个月的失联后,NASA宣布成功修复了240亿公里外的旅行者1号宇宙飞船,使其重新发回有效数据。- 修复过程:工程师团队发现...

苹果OpenAI合作,力争今年生成式AI登陆iPhone

苹果公司正在积极寻求合作伙伴,以将其AI技术应用于即将发布的iOS 18操作系统。在中国市场,苹果已与中国AI公司百度达成战略合作,百度将为苹果提供语音智能...

吴恩达:多智能体协作是新关键,软件开发等任务将更高效

摘要:斯坦福大学教授吴恩达在演讲中提到了智能体在软件开发领域的巨大潜力,尤其是在基于GPT-3.5构建的智能体工作流中,其应用表现优于GPT-4。这表明,智能...

24GB单卡全量微调Llama 3-8B,仅需添加一行代码

研究人员通常基于预训练的大型语言模型进行微调,以适应特定任务的要求。然而,微调具有一定规模的语言模型需要大量的计算资源,显存容量往往成为主要限制因...

OpenAI Preparedness团队首席Aleksander Madry:机器学习模型的内部计算如何将输入转化为预测?

本文探讨了深度学习模型的解释性问题,特别是如何理解模型中的单个组件如何共同影响模型的预测行为。文章首先指出深度网络通常被视为黑匣子,其内部组件之间...

大模型竞技场全面测评结果出炉:Llama3 70B成开源模型中最强王者!

摘要:大模型系统组织(LMSYS Org)发布了最新的大模型竞技场全面测评结果,其中Llama3 70B模型在开源模型中表现出色,成为性能最强的模型。这一成就得到了Py...

54位大咖演讲精华!中国生成式AI大会圆满收官,TOP50企业榜单揭晓

2024中国生成式AI大会在京圆满收官,54位产学研投嘉宾代表共探生成式AI全产业链的发展现状与未来趋势。会上揭晓了「AI生产力创新先锋(AiiP)-中国生成式AI企...

马斯克的xAI将融资60亿美元,全面迎战OpenAI!

摘要:专注AIGC领域的专业社区关注了微软&OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地,以及LLM的市场研究和AIGC开发者生态。4月26...
145678