斯坦福爆火Llama3-V竟抄袭国内开源项目,作者火速删库

AI最新资讯3个月前发布 tree
577 0 0

今日应用


今日话题


斯坦福爆火Llama3-V竟抄袭国内开源项目,作者火速删库
斯坦福爆火Llama3-V竟抄袭国内开源项目,作者火速删库
 

重点标签 Llama3-V抄袭争议多模态模型开源项目技术社区

文章摘要


斯坦福大学发布的Llama3-V多模态模型在开源社区引起了广泛关注,该模型声称仅需500美元即可训练出与GPT-4-V、Gemini Ultra、Claude Opus等性能相当的模型,但模型大小仅为后者的百分之一。然而,Llama3-V很快遭到了抄袭的质疑,尤其是被指出与清华大学自然语言处理实验室和面壁智能合作开发的MiniCPM-Llama3-V 2.5存在大量相似之处。MiniCPM-Llama3-V 2.5是一个面向图文理解的多模态大模型,支持超过30种语言的多模态交互,其性能在多个方面超越了商用闭源模型。

在HuggingFace上的用户JosephusCheung首先提出质疑,询问Llama3-V是否未经提及使用了MiniCPM-Llama3-V-2.5进行训练。Llama3-V的作者回应称使用了MiniCPM-Llama3-V-2.5的预训练tokenizer,但这一解释存在时间上的矛盾。随后,网友Magic Yang在Llama3-V的GitHub项目Issue中提出更多疑问,指出Llama3-V与MiniCPM-Llama3-V 2.5在模型结构和配置文件上的高度相似性,以及Llama3-V代码中的格式修改和特殊符号的抄袭。尽管Llama3-V的作者辩称其架构参考了LLaVA-UHD,并列出与Mini CPM-Llama3-V 2.5的差异,但Magic Yang发现两者在关键技术上几乎一致。

Magic Yang还发现Llama3-V的作者在Hugging Face上传项目时直接导入了MiniCPM-Llama3-V 2.5的代码,并在之后替换了部分文件名。此外,Llama3-V的作者似乎对代码的理解存在偏差,例如在技术博客和代码中对感知器重采样器的描述不一致,以及SigLIP的Sigmoid激活功能的误用。

对于清华大学NLP实验室和面壁智能团队特别采集和标注的专有数据,Llama3-V的表现异常出色,尤其是在识别中国战国时期的古文字“清华简”时,与MiniCPM-Llama3-V 2.5的错误识别高度重合。通过对比测试,Llama3-V和MiniCPM-Llama3-V 2.5之间的重叠率高达87%,识别错误的结果也有182个重合。

面对社区的质疑,Llama3-V的作者采取了删除推特内容、隐藏HuggingFace仓库和GitHub项目页面等措施,但这并未平息争议。Magic Yang已将对话截图评论在MiniCPM-V的GitHub页面,而网友反馈运行Llama3-V时代码与checkpoint不兼容,但更改变量名后即可成功运行。此外,有网友上传了Llama3-V删库前的checkpoint,供大家测试验证。

这一事件引发了关于道德、诚信与声誉的讨论,如果抄袭得到验证,斯坦福大学可能需要介入调查。在国内外舆论发酵两天后,Llama3-V的作者之一站出来道歉,称抄袭源于对队友Mustafa的盲信。这一事件对开源社区的信任和合作精神提出了挑战,也提醒了开发者在创新过程中应尊重他人的知识产权和劳动成果。

文章来源


原文地址: 点我阅读全文
原文作者: 机器之心

© 版权声明

相关文章

暂无评论

暂无评论...