三易生活 06-05
斯坦福AI团队承认抄袭面壁智能,已下架相关模型
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

继此前国内大模型创业公司面壁智能 CEO 李大海与联合创始人刘知远先后发文,对自家开源模型 MiniCPM-Llama3-V 2.5 疑似被一支来自斯坦福大学的 AI 团队抄袭一事进行回应,并表示已发现更多证据,已基本可以确定为抄袭后。

日前,这一斯坦福大学 AI 团队中的两名成员森德哈斯 · 沙玛(Siddharth Sharma)和阿克沙 · 加格(Aksh Garg)正式发文承认抄袭、向面壁智能致歉,并承诺下架相关套壳模型。

据悉, 此次抄袭事件源于 5 月 29 日。彼时,上述斯坦福大学 AI 团队发布了开源大模型 Llama3-V,并声称 Llama3-V 比 GPT-4V、Gemini Ultra、Claude Opus 性能更强,以及 500 美元就能训练出一个 SOTA 模态模型。因该研究团队 3 名成员拥有斯坦福大学、特斯拉、SpaceX 的名校或大厂背景,因此 Llama3-V 一经发布就引发了诸多关注,曾一度登上 HuggingFace 趋势榜首页。

但随后有相关人士指出,Llama3-V 的模型结构和配置文件与发布于 5 月 21 日的 MiniCPM-Llama3-V 2.5 完全相同,只是进行了一些重新格式化并将部分变量重新命名,而且具有与 MiniCPM-Llama3-V 2.5 相同的分词器,包括 MiniCPM-Llama3-V 2.5 新定义的特殊符号。

随后李大海和刘知远进一步指出,该公司还发现 Llama3-V 展现出了和 MiniCPM-Llama3-V 2.5 一样的清华简(清华大学于 2008 年 7 月收藏的一批战国竹简)识别能力,甚至就连做错的样例都一模一样,而这一训练数据尚未对外公开。

在日前发布的道歉信中,森德哈斯 · 沙玛和阿克沙 · 加格表示,他们负责 Llama3-V 的宣发工作,该模型代码的作者是穆斯塔法 · 阿尔贾德里(Mustafa Aljadery),两人在看到相关质疑后曾询问穆斯塔法 · 阿尔贾德里,但再也没能联系上后者,于是决定发布道歉声明。目前,森德哈斯 · 沙玛和阿克沙 · 加格已删除他们在社交媒体上关于 Llama3-V 的推文,并将该项目在 Github 和 HuggingFace 的库一并删除。

对于此次抄袭事件,李大海表示," 我们对这件事深表遗憾。一方面感慨这也是一种受到国际团队认可的方式,另一方面呼吁大家共建开放、合作、有信任的社区环境 "," 我们希望团队的好工作被更多人关注与认可,但不是以这种方式 "。刘知远则表示," 从横向来看,我们显然仍与国际顶尖工作如 Sora 和 GPT-4 有显著差距;同时,从纵向来看,我们已经从十几年的 nobody,快速成长为人工智能科技创新的关键推动者。面向即将到来的 AGI 时代,我们应该更加自信积极地投身其中 "。

此外在 Llama3-V 团队道歉前,斯坦福大学人工智能实验室主任克里斯托弗 · 大卫 · 曼宁(Christopher David Manning)也已发文谴责这一抄袭行为,并称 MiniCPM 是 " 很好的开源作品 "。

【本文图片来自网络】

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

智慧云

智慧云

ZAKER旗下新媒体协同创作平台

相关标签

抄袭 ai 斯坦福大学 李大海
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论