斯坦福抄袭清华、面壁智能大模型，当事人已道歉、删项目

AI最新资讯3个月前发布 tree

42 0 0

今日应用

AnyPaint

AnyPaint，您的移动绘画神器，让创意在指尖绽放！

今日话题

斯坦福抄袭清华、面壁智能大模型，当事人已道歉、删项目

重点标签 抄袭事件、斯坦福大学、AI模型、开源项目、清华大学

文章摘要

斯坦福大学两名学生Aksh Garg和Siddharth Sharma承认抄袭了清华大学和面壁智能联合开发的多模态大模型MiniCPM-Llama3-V2.5，并在社交平台公开道歉。斯坦福大学AI实验室主任Christopher Manning也证实了这一抄袭事件，并表扬了国内大学、企业对开源大模型的贡献。

整个抄袭事件的全过程如下：
1. 5月29日，斯坦福大学AI团队宣称开源了一款名为Llama3-V的多模态模型，声称只需500美元就能训练出超过GPT-4V、GeminiUltra、ClaudeOpus等众多知名模型。
2. 6月2日，有开发者质疑Llama3-V抄袭了清华和面壁智能联合开源的最新项目V2.5。主要抄袭证据包括：
– 特色功能一样：V2.5能识别中国战国时期写在竹子上的罕见古文字”清华简”，Llama3-V也能识别，但训练数据并非公开。
– Llama3-V的模型架构、代码、配置文件、分词器基本一样，只是增加了高斯噪声、变量名称不一样。
– 重叠度高达87%，且有非常相似的误差分布。
– 犯的错误一样，Llama3-V用于测试WebAgent时与V2.5犯的错误一样，而V2.5使用的是内部未公开的训练数据。
3. 斯坦福AI实验室主任Christopher Manning证实抄袭事件，并表示犯了错误就要勇于承认，同时表扬了清华大学的贡献。
4. 两位学生在社交平台公开道歉，但态度并不诚恳，使用了同样的道歉信，且试图甩锅给另一位名叫Mustafa Aljadery的人。

这个抄袭事件折射出我国在AI芯片制裁背景下对大模型开发、训练的无奈，同时也反映出我们的大模型开源生态被低估，通义千问、面壁智能、百川智能等优秀开源项目已获得世界认可并迅速崛起。

文章来源

原文地址: 点我阅读全文
原文作者: AIGC开放社区

文章版权归作者所有，未经允许请勿转载。

暂无评论

暂无评论...

斯坦福抄袭清华、面壁智能大模型，当事人已道歉、删项目

今日应用

今日话题

文章摘要

文章来源

ClassDiffusion: 使用显式类别引导的一致性个性化生成

大模型平台Cohere获得4.5亿美元融资，估值50亿美元

相关文章

暂无评论

热门网址

热门标签