马斯克的Grok-3，担得起“地表最强AI”之名？

北京时间 2 月 18 日 12 点 30 分左右，马斯克与 xAI 团队的另外三位技术负责人，一同发布了公司最新推出的 Grok-3 基座大模型。

短短 30 分钟的发布过程中，马斯克及其团队向大家介绍了 Grok-3 比 DeepSeek-V3、OpenAI-4o 等更为突出的数学、科学推理性能，演示了大模型代码创作能力，同时也公布了后续的开源计划。

在此之前，马斯克曾称将发布的 Grok-3 是 " 地球上最聪明的人工智能 "，从发布公示的模型性能来看，Grok-3 确实在一定程度上取得了比 DeepSeek、OpenAI 更强的性能，但这一切的效果，是通过 "20 万块英伟达 GPU" 算力堆叠而出的。

在全球人工智能行业发展开源之风渐浓，同时也越来越注重性价比的当下，马斯克的 Grok-3 真的担得起 " 地表最强 AI" 之名？同时将为市场带来怎样的变化？

Grok-3，数学、科学推理超 DeepSeek、OpenAI

据马斯克发布 Grok-3 时介绍，在数学推理、科学逻辑推理和代码写作等能力表现方面，xAI 此次发布的 Grok-3 和 Grok-3 mini 两款模型，在 Math（AIME 24）、Science（GPQA）和 Coding（LCB Oct-Feb）三项 Benchmarks 测试中，均取得了比 Gemini-2 pro、DeepSeek-v3、GPT-4o 更优的性能表现。

在大模型竞技场 Chatbot Arena（LMSYS）中，Grok-3 版本的得分达到 1402 分，超过了包括 ChatGPT-4o、DeepSeek-R1 等在内的所有其他模型。

据马斯克介绍，Grok-3 比上一代的 Grok-2 能力提升了一个数量级。在后续 AI 用例演示过程中，马斯克及其团队成员让 Grok-3 寻找去火星的时间窗口，演示了其信息收集和推理能力，同时还创作一款融合《宝石迷阵》和《俄罗斯方块》的游戏，展示了 Grok-3 的创意能力。

据悉，目前 Grok-3 已经在 xAI 内部运行了 2 周。首批用户通过 X 平台已可以预订体验 Grok-3，目前 xAI 也在积极与 AppStore 对接，但因为上线这一平台需要满足相关合规要求，因此最新的 Grok-3 模型还只能是在网页上。

" 我自己早上刚试了一遍 Grok-3，我觉得它已经展示了非常强大的数学推理性能，一周后我们会上线所有全新的性能。" 马斯克还进一步透露称，" 我们通常会在新模型发布的时候，开源上一代模型，几个月后，我们也会对该系列模型进行开源 "。

分析称成本为 DeepSeek-V3 263 倍

强大的模型性能背后，Grok-3 的训练成本也成了备受关注的一个焦点。

据马斯克在直播中披露，Grok 3 在训练过程累计消耗了 20 万块英伟达 GPU，训练在 xAI 公司的数据中心完成。有马斯克团队人员介绍称，" 我们花了 122 天才完成了第一个 10 万卡训练，但我们并没有就此止步，如果我们想要构建巨型人工智能，需要立即将集群的大小增加一倍。"

相较于 DeepSeek 以远低于同行 "1/20 的成本 " 训练出比肩 OpenAI-01 模型能力的 R1 模型，Grok-3 的这一算力消耗，属实不小。就在马斯克公布 Grok-3 训练成本后，很快便有人员分析指出，"Grok-3 的算力消耗是 DeepSeek-v3 的 263 倍，中国的模型团队只得望洋兴叹。"

此前，在 xAI 发布 Grok-2 模型后，便有国内 AI 企业创始人对新浪科技表示，"Grok-2 模型参数量太大了，使用成本太高，这远远不是国内绝大多数企业用得起的，这也导致了他们的产品雷声大雨点小。"

这一次，Grok-3 又一次通过堆算力的方式，带来了令人眼前一亮的模型效果。但过于庞大的训练成本，注定也会全队绝大多数用户，尤其渴望私有化部署相关模型的企业用户。

当前，伴随 DeepSeek 开源相关模型带来的模型使用成本下降和性能提升，在全球范围内已经刮起了一阵大模型产品开源免费的 " 热潮 "。

就在 Grok-3 发布数小时前，OpenAI 首席执行官萨姆・奥尔特曼便在 X 社交平台上发文，就公司下一个开源项目的方向征询公众意见。他提出了两种可能的开源模型方向：一种是 " 相当小但仍需在 GPU 上运行的 o3-mini 级模型 "，另一种则是 " 尽可能优化的手机大小模型 "。

这或许意味着 OpenAI 即将开源新的大模型，这也将是 2019 年 OpenAI 开源 GPT-2 后再次开源大模型。而在月初的时候，奥尔特曼还曾反思称，OpenAI 闭源 " 站在了历史错误的一边 "。

国内方面，此前笃定闭源模型更先进的百度公司，也于近日宣布了旗下文心一言会员产品免费。

当全球范围内越来越多的企业都开始选择使用更加低成本的 AI 大模型时，昔日的 AI 大模型机构们，也不得不放低姿态，开始拥抱市场。对于 Grok-3 而言，高昂的训练成本及不开源的策略，或许将成为阻碍其普及的一大关键。

在 Grok-3 发布后，此前传言主要产品已为 xAI 数据中心供货的三变科技 ( 18.480, 0.64, 3.59% ) ，股价迅速由涨停迅速回落，不复此前两日连续涨停的热闹景象。在一部分股友看来，回落最主要的原因，正是因为 " 马斯克发布会不及预期 "。

结语：马斯克硬钢 OpenAI，谁能笑到最后？

就在 Grok-3 发布数天前，曾有消息曝出马斯克正牵头财团提出以 974 亿美元（约 7118 亿元人民币）收购 OpenAI 的控股权，不过该提议很快遭到了 OpenAI 首席执行官萨姆 · 阿尔特 ( 12.360, 0.57, 4.83% ) 曼（Sam Altman）的拒绝。阿尔特曼在 X 上回应称：" 不用了，谢谢，但如果你愿意，我们可以以 97.4 亿美元收购推特。"

随后，马斯克回击称其为 " 骗子 "，双方矛盾再次公开化。据悉，马斯克律师团队曾于 2 月 10 日向 OpenAI 董事会提交收购要约，计划通过旗下 AI 公司 xAI 支持该交易，并可能在完成后与 OpenAI 合并。马斯克在声明中强调，此举旨在让 OpenAI 回归其 " 开源、安全优先 " 的初心。

马斯克作为 2015 年与阿尔特曼共同创立 OpenAI 的联合创始人，同时也是 OpenAI 最早的投资人。但 2018 年马斯克因争夺公司控制权未果而退出，此后，2019 年 OpenAI 成立营利性子公司，并接受微软 10 亿美元投资，逐步转向商业化。伴随 2022 年 ChatGPT 横空出世并将 OpenAI 推上生成式 AI 巅峰，其估值飙升至千亿美元级。

在外界看来，马斯克于 2023 年成立 xAI 并推出大模型 Grok，直接硬钢 OpenAI，多少掺杂着一些个人情绪。在业内人士看来，相较于 OpenAI 目前主要依靠融资存活，马斯克旗下的 Grok-3 有着特斯拉、x 社交平台等更为庞大的现金流和数据资源支撑，未来在空间智能等领域或许会有着更大的发展潜力。

但眼下看来，如果 Grok-3 模型的训练成本，让更多的企业和消费者用户用上这款产品，才是下一步发展的关键。（周文猛）

宙世代

一起剪

相关标签