标签:AI模型

从现在起,GitHub上超1亿开发者可直接访问全球顶级大模型,构建AI应用

GitHub Models的推出,标志着GitHub平台的进一步发展和AI技术的深入融合。以下是对文章内容的详细总结:1. 新功能介绍:GitHub发布了一项名为「GitHub Models...

谷歌开源最强端侧小模型:2B参数越级跑赢GPT-3.5-Turbo,苹果15Pro运行飞快

谷歌开源了Gemma 2模型系列,包括9B和27B版本,27B版本在对话任务中表现优异。一个多月后,谷歌推出了更轻量级的2B版本,并构建了安全内容分类器模型ShieldGe...

Llama 3.1 会助推这波「小模型」热潮吗?

摘要:机器之心PRO会员通讯在第30周提供了对AI和机器人领域的深入分析。首先,讨论了Llama 3.1模型的开源及其对小模型热潮的潜在推动作用。Llama 3.1是一个40...

MoE也有Scaling Law,「百万专家」利用率近100%!DeepMind华人挑战MoE极限

谷歌DeepMind的研究科学家Xu Owen He提出了一种名为PEER(参数高效专家检索)的全新策略,该策略可以将混合专家(MoE)架构扩展到百万个专家,同时不增加计算...

儿童摄影|AI攻占儿童摄影市场,效果媲美照相馆!

无界AI摄影新时代的「儿童摄影」模型上线,该模型专注于儿童图像生成,支持不同年龄段、不同性格的儿童形象,以及多样化的摄影风格,如森系、情绪、复古等。...

OpenAI前对齐团队「遗作」:RLHF不够用了!用GPT-4训练GPT-4

摘要:OpenAI 研究团队开发了一个名为 CriticGPT 的新模型,它基于 GPT-4 构建,专门用于识别和批评 ChatGPT 代码输出中的错误。CriticGPT 的加入显著提升了...

斯坦福抄袭清华、面壁智能大模型,当事人已道歉、删项目

斯坦福大学两名学生Aksh Garg和Siddharth Sharma承认抄袭了清华大学和面壁智能联合开发的多模态大模型MiniCPM-Llama3-V2.5,并在社交平台公开道歉。斯坦福大...

速度秒掉GPT-4o、22B击败Llama 3 70B,Mistral AI开放首个代码模型

法国AI公司Mistral AI推出了一款名为Codestral的代码生成AI模型,专为代码生成任务设计。该模型支持多种编程语言,包括Python、Java、C、C++等,能够编写代码...

影视(近代)上线 | 人人都能当导演的时代来了?AI的出图水准和大片看齐了!

无界AI「影视(近代)」模型的震撼上线,为用户带来了前所未有的影视体验。用户可以一键进入影视剧,实现从20世纪30年代到现代的场景和妆发的快速生成,满足...

小扎自曝愿开源100亿美元模型!2025年AGI没戏,能源短缺成最大瓶颈

步骤2:撰写详细摘要在最近的Dwarkesh Patel播客访谈中,Facebook创始人马克·扎克伯格(Mark Zuckerberg)表示,如果Meta公司花费100亿美元研发的AI模型对人...
12