北京时间 2 月 18 日 12 点 30 分左右,马斯克与 xAI 团队的另外三位技术负责人,一同发布了公司最新推出的 Grok-3 基座大模型。
短短 30 分钟的发布过程中,马斯克及其团队向大家介绍了 Grok-3 比 DeepSeek-V3、OpenAI-4o 等更为突出的数学、科学推理性能,演示了大模型代码创作能力,同时也公布了后续的开源计划。
在此之前,马斯克曾称将发布的 Grok-3 是 " 地球上最聪明的人工智能 ",从发布公示的模型性能来看,Grok-3 确实在一定程度上取得了比 DeepSeek、OpenAI 更强的性能,但这一切的效果,是通过 "20 万块英伟达 GPU" 算力堆叠而出的。
在全球人工智能行业发展开源之风渐浓,同时也越来越注重性价比的当下,马斯克的 Grok-3 真的担得起 " 地表最强 AI" 之名?同时将为市场带来怎样的变化?
Grok-3,数学、科学推理超 DeepSeek、OpenAI
据马斯克发布 Grok-3 时介绍,在数学推理、科学逻辑推理和代码写作等能力表现方面,xAI 此次发布的 Grok-3 和 Grok-3 mini 两款模型,在 Math(AIME 24)、Science(GPQA)和 Coding(LCB Oct-Feb)三项 Benchmarks 测试中,均取得了比 Gemini-2 pro、DeepSeek-v3、GPT-4o 更优的性能表现。
在大模型竞技场 Chatbot Arena(LMSYS)中,Grok-3 版本的得分达到 1402 分,超过了包括 ChatGPT-4o、DeepSeek-R1 等在内的所有其他模型。
据马斯克介绍,Grok-3 比上一代的 Grok-2 能力提升了一个数量级。在后续 AI 用例演示过程中,马斯克及其团队成员让 Grok-3 寻找去火星的时间窗口,演示了其信息收集和推理能力,同时还创作一款融合《宝石迷阵》和《俄罗斯方块》的游戏,展示了 Grok-3 的创意能力。
据悉,目前 Grok-3 已经在 xAI 内部运行了 2 周。首批用户通过 X 平台已可以预订体验 Grok-3,目前 xAI 也在积极与 AppStore 对接,但因为上线这一平台需要满足相关合规要求,因此最新的 Grok-3 模型还只能是在网页上。
" 我自己早上刚试了一遍 Grok-3,我觉得它已经展示了非常强大的数学推理性能,一周后我们会上线所有全新的性能。" 马斯克还进一步透露称," 我们通常会在新模型发布的时候,开源上一代模型,几个月后,我们也会对该系列模型进行开源 "。
分析称成本为 DeepSeek-V3 263 倍
强大的模型性能背后,Grok-3 的训练成本也成了备受关注的一个焦点。
据马斯克在直播中披露,Grok 3 在训练过程累计消耗了 20 万块英伟达 GPU,训练在 xAI 公司的数据中心完成。有马斯克团队人员介绍称," 我们花了 122 天才完成了第一个 10 万卡训练,但我们并没有就此止步,如果我们想要构建巨型人工智能,需要立即将集群的大小增加一倍。"
相较于 DeepSeek 以远低于同行 "1/20 的成本 " 训练出比肩 OpenAI-01 模型能力的 R1 模型,Grok-3 的这一算力消耗,属实不小。就在马斯克公布 Grok-3 训练成本后,很快便有人员分析指出,"Grok-3 的算力消耗是 DeepSeek-v3 的 263 倍,中国的模型团队只得望洋兴叹。"
此前,在 xAI 发布 Grok-2 模型后,便有国内 AI 企业创始人对新浪科技表示,"Grok-2 模型参数量太大了,使用成本太高,这远远不是国内绝大多数企业用得起的,这也导致了他们的产品雷声大雨点小。"
这一次,Grok-3 又一次通过堆算力的方式,带来了令人眼前一亮的模型效果。但过于庞大的训练成本,注定也会全队绝大多数用户,尤其渴望私有化部署相关模型的企业用户。
当前,伴随 DeepSeek 开源相关模型带来的模型使用成本下降和性能提升,在全球范围内已经刮起了一阵大模型产品开源免费的 " 热潮 "。
就在 Grok-3 发布数小时前,OpenAI 首席执行官萨姆・奥尔特曼便在 X 社交平台上发文,就公司下一个开源项目的方向征询公众意见。他提出了两种可能的开源模型方向:一种是 " 相当小但仍需在 GPU 上运行的 o3-mini 级模型 ",另一种则是 " 尽可能优化的手机大小模型 "。
这或许意味着 OpenAI 即将开源新的大模型,这也将是 2019 年 OpenAI 开源 GPT-2 后再次开源大模型。而在月初的时候,奥尔特曼还曾反思称,OpenAI 闭源 " 站在了历史错误的一边 "。
国内方面,此前笃定闭源模型更先进的百度公司,也于近日宣布了旗下文心一言会员产品免费。
当全球范围内越来越多的企业都开始选择使用更加低成本的 AI 大模型时,昔日的 AI 大模型机构们,也不得不放低姿态,开始拥抱市场。对于 Grok-3 而言,高昂的训练成本及不开源的策略,或许将成为阻碍其普及的一大关键。
在 Grok-3 发布后,此前传言主要产品已为 xAI 数据中心供货的三变科技 ( 18.480, 0.64, 3.59% ) ,股价迅速由涨停迅速回落,不复此前两日连续涨停的热闹景象。在一部分股友看来,回落最主要的原因,正是因为 " 马斯克发布会不及预期 "。
结语:马斯克硬钢 OpenAI,谁能笑到最后?
就在 Grok-3 发布数天前,曾有消息曝出马斯克正牵头财团提出以 974 亿美元(约 7118 亿元人民币)收购 OpenAI 的控股权,不过该提议很快遭到了 OpenAI 首席执行官萨姆 · 阿尔特 ( 12.360, 0.57, 4.83% ) 曼(Sam Altman)的拒绝。阿尔特曼在 X 上回应称:" 不用了,谢谢,但如果你愿意,我们可以以 97.4 亿美元收购推特。"
随后,马斯克回击称其为 " 骗子 ",双方矛盾再次公开化。据悉,马斯克律师团队曾于 2 月 10 日向 OpenAI 董事会提交收购要约,计划通过旗下 AI 公司 xAI 支持该交易,并可能在完成后与 OpenAI 合并。马斯克在声明中强调,此举旨在让 OpenAI 回归其 " 开源、安全优先 " 的初心。
马斯克作为 2015 年与阿尔特曼共同创立 OpenAI 的联合创始人,同时也是 OpenAI 最早的投资人。但 2018 年马斯克因争夺公司控制权未果而退出,此后,2019 年 OpenAI 成立营利性子公司,并接受微软 10 亿美元投资,逐步转向商业化。伴随 2022 年 ChatGPT 横空出世并将 OpenAI 推上生成式 AI 巅峰,其估值飙升至千亿美元级。
在外界看来,马斯克于 2023 年成立 xAI 并推出大模型 Grok,直接硬钢 OpenAI,多少掺杂着一些个人情绪。在业内人士看来,相较于 OpenAI 目前主要依靠融资存活,马斯克旗下的 Grok-3 有着特斯拉、x 社交平台等更为庞大的现金流和数据资源支撑,未来在空间智能等领域或许会有着更大的发展潜力。
但眼下看来,如果 Grok-3 模型的训练成本,让更多的企业和消费者用户用上这款产品,才是下一步发展的关键。(周文猛)
登录后才可以发布评论哦
打开小程序可以发布评论哦