Techweb 06-04
大瓜!国产大模型被美国斯坦福大学团队套壳抄袭,CEO回应了
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

【TechWeb】6 月 4 日消息,大模型这波热度起来以后,一直是一些国内大模型被质疑套壳国外开源大模型。现在,回旋镖来了。近日,一则国内大模型被美国斯坦福大学团队套壳抄袭的消息在社交媒体上沸沸扬扬。

事情起源是,5 月 29 日,斯坦福大学的一个研究团队发布了一个名为 Llama3V 的模型,号称只要 500 美元(约人民币 3650 元)就能训练出一个 SOTA 多模态模型,效果比肩 GPT-4V、Gemini Ultra 与 Claude Opus 。

因为研究团队拥有斯坦福大学等知名光环,该团队的 Llama3V 模型一发布就引发了诸多关注,一度冲上 HuggingFace 趋势榜首页。

但是,很快,在 X 和 Hugging Face 上有开发者提出质疑,认为 Llama3V 套壳了中国 AI 创企面壁智能在 5 月中旬发布的 8B 多模态开源小模型 MiniCPM-Llama3-V 2.5。

有网友细心列举了 " 抄袭 " 证据,包括,Llama3-V 的模型架构和代码与 MiniCPM-Llama3-V 2.5 几乎完全相同,Llama3-V 使用了 MinicPM-Llama3-V2.5 分词器等等。

最让质疑者不能忍的是,Llama3-V 作者还删除了网友在 Llama3-V 页面上提交的质疑他们抄袭的问题。

于是,这位网友直接跑到面壁智能 GitHub 项目下留言提醒面壁智能团队关注被美国斯坦福大学团队抄袭的事情。

现在,该斯坦福团队成员已删除他们在 X 上官宣模型的推文,并将该项目在 Github 和 HuggingFace 上的库一并删除。

对于此事,面壁智能 CEO 李大海在朋友圈发文做出了正式回应:" 这两天收到社区和媒体及朋友的反馈,来自斯坦福团队的 Llama3V 项目与面壁小钢炮最新发布的多模态模型 MiniCPM-Llama3-V 2.5 展现出惊人的相似度。

经过团队核实,除了社区网友列出的证据外,我们还发现 Llama3V 展现出和小钢炮一样的清华简识别能力,连做错的样例都一模一样,而这一训练数据尚未对外公开。这项工作是团队同学耗时数个月,从卷帙浩繁的清华简中一个字一个字扫描下来,并逐一进行数据标注,融合进模型中的。更加 tricky 的是,两个模型在高斯扰动验证后,在正确和错误表现方面都高度相似。

技术创新不易,每一项工作都是团队夜以继日的奋斗结果,也是以有限算力对全世界技术进步与创新发展作出的真诚奉献。我们希望团队的好工作被更多人关注与认可,但不是以这种方式。

我们对这件事深表遗憾 ! 一方面感慨这也是一种受到国际团队认可的方式,另一方面也呼吁大家共建开放、合作、有信任的社区环境。一起加油合作,让世界因 AGI 的到来变得更好 !"

面壁智能是一家人工智能大模型技术创新与应用落地企业,创立于 2022 年 8 月,创始团队主要来自清华。面壁智能联合创始人、首席科学家刘知远是清华大学计算机系长聘副教授,智源青年科学家,主要研究方向为自然语言处理、知识图谱和社会计算。

2023 年 4 月面壁智能完成由知乎领投的数千万元天使轮融资,种子轮股东智谱 AI 继续跟投。随后,2023 年 6 月,知乎公司合伙人、CTO 李大海出任面壁智能的董事和 CEO,负责面壁智能公司的战略发展和运营管理。

另外,面壁智能透露,今年 5 月该公司刚刚完成了新一轮数亿元融资。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

智慧云

智慧云

ZAKER旗下新媒体协同创作平台

相关标签

斯坦福大学 抄袭 美国 ceo 清华
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论