标签：tag1

万字长文带你梳理Llama开源家族：从Llama-1到Llama-3

摘要：本文详细介绍了Meta公司发布的Llama系列模型的演进历程、模型架构、训练数据、训练方法、效果对比、社区影响以及总结。Llama模型的发布对全球AI领域产...

4个月前

摘要：本次分享邀请了香港城市大学在读博士朱向阳，他详细介绍了他们中稿CVPR2024的工作：'No Time to Train: Empowering Non-Parametric Networks for Few-s...

4个月前

摘要：- 旅行者1号修复成功：在经历五个月的失联后，NASA宣布成功修复了240亿公里外的旅行者1号宇宙飞船，使其重新发回有效数据。- 修复过程：工程师团队发现...

4个月前

苹果公司正在积极寻求合作伙伴，以将其AI技术应用于即将发布的iOS 18操作系统。在中国市场，苹果已与中国AI公司百度达成战略合作，百度将为苹果提供语音智能...

4个月前

摘要：斯坦福大学教授吴恩达在演讲中提到了智能体在软件开发领域的巨大潜力，尤其是在基于GPT-3.5构建的智能体工作流中，其应用表现优于GPT-4。这表明，智能...

4个月前

研究人员通常基于预训练的大型语言模型进行微调，以适应特定任务的要求。然而，微调具有一定规模的语言模型需要大量的计算资源，显存容量往往成为主要限制因...

4个月前

本文探讨了深度学习模型的解释性问题，特别是如何理解模型中的单个组件如何共同影响模型的预测行为。文章首先指出深度网络通常被视为黑匣子，其内部组件之间...

4个月前

摘要：大模型系统组织（LMSYS Org）发布了最新的大模型竞技场全面测评结果，其中Llama3 70B模型在开源模型中表现出色，成为性能最强的模型。这一成就得到了Py...

4个月前

2024中国生成式AI大会在京圆满收官，54位产学研投嘉宾代表共探生成式AI全产业链的发展现状与未来趋势。会上揭晓了「AI生产力创新先锋（AiiP）-中国生成式AI企...

4个月前

摘要：专注AIGC领域的专业社区关注了微软&OpenAI、百度文心一言、讯飞星火等大语言模型（LLM）的发展和应用落地，以及LLM的市场研究和AIGC开发者生态。4月26...

4个月前

1…4 567 8