Grok 4遥遥领先，但马斯克想要得更多

这是一场停不下来的豪赌。

Grok4 真的很强

近期马斯克发布了 " 世界上最强的 AI 模型 "，有人直言道 AGI 在这里已经实现了。xAI 发布了两个版本，分别是 Grok 4 和 Grok 4 Heavy。两者都是推理模型，前者是单代理版本，Grok-4 Heavy 则是多代理版本，支持四个代理同时工作。

"Grok 4 是在所有学科里都达到研究生水平的，甚至比大多数 PhD 都强。" 直播晚点 1 小时后，马斯克首先给 Grok 最新一代的水平如此定位。

除了在 SAT、GRE 考试中取得近乎完美的成绩，在「人类终极考试（HLE）」测试里，Grok 4 现在的得分比 Gemini 2.5 Pro、o3 都高，Grok 4 Heavy 版本更是突破了 40%。相比 Kimi（以中文处理见长），Grok4 的多语言支持更全面，尤其在英语和编码混合任务中领先。Kimi 虽快，但 Grok4 的深度思考能力让它在科研场景中更可靠。

在编码与软件工程方面： SWE-Bench 基准：Grok4 约 60% 以上，高于 GPT-4.5 的 54.6%、Gemini 2.5 Pro 的类似分数。Claude 4 虽达 72.7%，但 Grok4 在代码分析和 bug 修复上更高效，识别准确率达 89%。与 Kimi 比较，Grok4 的工具使用原生集成，让它在编程自动化上更流畅，适合开发者。

xAI 团队在直播中透露，Grok 4 的训练量是 Grok 2 的 100 倍，在强化学习（RL）阶段投入的算力，是市面上其他任何模型的 10 倍以上。发布会介绍，Grok 4 的订阅费为 30 美元 / 月，更强大的 Grok 4 Heavy 版本的费用为 300 美元 / 月，Grok 3 维持免费开放。

马斯克认为，Grok4 的更新目标是 " 成为尽可能追求真相的 AI"。他还设想通过该模型与类人机器人结合，在今年年底或明年发现新技术，甚至新物理定律。" 这让人既兴奋又紧张，我希望自己能活着见证它的诞生。" 马斯克说。

但是从目前体验过的博主评价来看，评价也是非常两极分化。有网友认为多代理投票当然准，只是又慢又烧钱。Grok 4 也并非无敌，它在图像理解和生成上仍逊于 OpenAI、Anthropic 等对手。也有人认为目前阶段 AI 贵才能好，像 DeepseeK R1 那样在后续推广之后可以实现，眼下最要紧的是推出更强的 AI 占领市场。

xAI 大力出奇迹但维持不易

01 烧钱，马斯克是专业的

过去有一个说法如果创业者没有 10 亿美元就不要参与大模型创业，过去国内外总有些创业者不服，但几年下来我们看到 " 六小龙 " 的说法不再热门，国外除了 OpenAI 就是大厂的模型。而现如今这一门槛已经被马斯克最高拉到 " 月销 10 亿美元 "。

上月外媒披露，因 xAI 研发尖端 AI 模型、构建数据中心及采购专用芯片，每月支出高达 10 亿美元。财务预测显示：2024 年总支出预计达 130 亿美元，营收仅 5 亿美元；2026 年营收或增至 20 亿美元，但仍难覆盖成本缺口。

xAI 的财务需求主要源于其激进的硬件战略。与依赖租赁算力的竞争对手不同，xAI 坚持自建基础设施。马斯克甚至宣布计划打造一台配备 100 万个英伟达 Blackwell GPU 的超级计算机，预计耗资 50 亿至 625 亿美元（约合人民币 4500 亿元），有望成为史上最昂贵的 AI 基础设施项目。

有分析师认为，马斯克正采取 " 烧钱换领先 " 的战略，试图通过大规模融资、硬件投资和快速迭代，在 AI 军备竞赛中超越 OpenAI、Anthropic 和 Google DeepMind。然而，能否在资金耗尽前实现技术突破，仍是未知数。

硬件成本高企只是一方面，xAI 在数据训练方面也是与众不同，采用了合成数据训练这一办法，先用 AI 生产数据，再用于模型训练，其成本远高于同行。其训练数据集总量约 4 万亿 tokens，使用新 MinHash-GPU 管道去重，近似重复率 <1%。

合成数据虽好但也会出现幻觉过高，数据反复利用之后会出现 " 以讹传讹 " 导致更大的错误。或许跟合成数据有关，现在 Grok 上面询问很多问题的时候会优先考虑马斯克的观点。大量 X 用户发布的实测结果也显示确实存在这一倾向，比如在数据科学家 Jeremy Howard 发布的一段视频中，Grok 在思维链中明确表示，正在考虑马斯克的观点。马斯克诚然是一位顶尖牛人，但在这几年也发表了不少 " 涉政争议言论 "，以至于出现了 " 抵制马斯克 " 的活动。在大模型中过多偏向某一位人物显然会给平台带来不小竞争问题。

此外，还有一点是为多数人所忽视的。xAI 负有马斯克收购推特时产生的一些银行债务，年初 xAI 以全股票交易的方式收购了 X（推特），对 X 的估值为 330 亿美元。同时 xAI 也承担了 X 之前的债务。

马斯克一方面已经置换了部分银行的高息债，一方面希望通过推高估值来缓解资金压力。有媒体报道 xAI 即将启动第三次大规模融资，目标估值直指 2000 亿美元。

据悉，此次融资谈判已进入初步阶段，最快将于下月启动。这将是 xAI 在不到两个月内的第三次大规模融资：今年 6 月，通过二级股票发行筹集 300 亿美元；7 月，通过贷款和现金投资获得 100 亿美元资金。

当然从更大的层面来看，马斯克眼中对标的是 OpenAI，既然 OpenAI 都能估值 3000 亿美元，那么 xAI 估值 2000 亿美元是只低不高。更何况马斯克一向认为 xAI 才是能实现真正 AGI 的企业，至于能值多少那就要看马斯克的吆喝了。

02 长期领先异常困难

上半年大模型发展整体上在从 " 规模竞赛 " 转向 " 效率与场景深耕 "，涌现出来了不少在架构创新。训练效率、以及多模态能力方面具有突破性表现的模型。比如 Claude4 代码生成能力领先行业，支持 20 万 token 输入，成为开发者首选。Gemini2.5Pro 拥有业内最长处理能力最高支持 200 万 token 上下文，当然还有 DeepSeek R1 在全世界掀起一阵旋风让低成本和高质量成为可能。

相反今年 2 月份发布的 Grok3 刚开始也只是各种跑分 " 屠榜 "，但最终留下来的印象却只有大尺度的聊天内容，也并没有如马斯克所愿推动 Grok 用户大幅增长。所以马斯克需要整个大的，证明 xAI 不是明日黄花已经跟不上了。

马斯克此前在 X 上频频为 Grok 模型预热，但 Grok 3.5 模型最终跳票，一度引发对模型能力的怀疑。4 月底，马斯克就在 X 上预告，Grok 3.5Beta 版下周将上线，主打专业问答能力，特别是工程、编程类问题。但直到 5 月中旬，马斯克才出来回应称，" 还有点粗糙，再打磨一周。" 马斯克在 6 月 27 日再次提到 Grok，表示在和 xAI 团队通宵打磨模型，进展不错，即将发布的模型被命名为 Grok 4。也就是说马斯克和团队选择跳过 Grok 3.5，" 端 " 出更高的迭代版本，针对模型跳票后外界的质疑，看起来是一个很好的挽救方案。

今年新发布的模型几乎都是至少有一项或者多项跑分超过 GPT 模型的，这背后的道理也不难理解，那就是现如今的模型差异只有数量级没有指数级。也就是说 OpenAI 的大模型虽然有先发优势，但是其它几家大模型也是各有所长，你追我赶，OpenAI 的 ChatGPT 大模型并没有形成绝对的优势。

马化腾曾表示，AI 技术和应用是条非常长的赛道，各个公司的竞争和发展更像是一场马拉松，而非短跑。暂时的领先和落后都说明不了太多的问题。

马斯克所谓的真正的完全体的 AI 或者 AGI，更像是一种争夺 AI 定义权的话术。微软眼中的 AGI 是指能够产生 1000 亿美元以上的利润，并对行业产生重塑性革命。马斯克认为 Grok 可能会在今年年底发现新的可用技术，明年发现新的物理学，可以深度参与特斯拉制造和擎天柱机器人的大脑设计。

但真正的 AGI 是什么尚有争议，何谈实现真正 AGI？xAI 的现状有点像马斯克过去所有创业的 " 复刻 " 版：前期疯狂烧钱、疯狂拉融资、大胆画饼，然后看能否赌中未来。然而，在当今 AI 战场，光有热血和资金远远不够，还得有真正过硬的产品和落地能力。

03 马斯克打算怎么做

虽然此次 Grok 4 短暂领先了，但今年夏天 OpenAI 也将发布其最新旗舰模型 GPT-5，这一领先优势能保持多久并不确定。海外大厂对于 AI 模型也是势在必得，微软、亚马逊、谷歌和 Meta 四大巨头去年的总资本支出为 2300 亿美元，2025 年这些公司的投资计划则高达 3200 亿美元，在财报中管理层纷纷表示，计划增加对 AI 技术和数据中心建设的投资。

那么就要考虑马斯克的优势是什么了，是有钱吗？当然不是，几家大厂也不遑多让，马斯克的优势在于由特斯拉和 X 构建起来的商业帝国。上次收购 X 为 xAI 带来两大核心优势：数据资源，X 平台的海量用户帖子和机器人生成内容，可直接用于训练 Grok，省去高昂的外部数据采购成本；算力共享，X 此前采购的 AI 芯片集群，现由 xAI 调配使用，进一步降低硬件投入。

xAI 向投资者承诺，公司将于 2027 年实现盈利。摩根士丹利预测，其 2029 年收入或突破 130 亿美元。若成真，xAI 将比竞争对手 OpenAI 提前两年迈入盈利阶段——后者预计最早 2029 年才能实现正现金流。

不过，这一乐观预测建立在多重假设之上：Grok 快速普及并深度集成至 X 平台；成功开拓企业级 AI 工具市场；与特斯拉的自动驾驶等业务协同落地。目前，xAI 的营收几乎全部依赖 X Premium 订阅服务，2024 年预期收入仅 5 亿美元，远不足以覆盖运营成本。相比之下：OpenAI 2024 年预计营收 127 亿美元，ChatGPT 用户超 1 亿，并深度嵌入微软生态，而 Grok 活跃用户只有两千万人；Anthropic 等对手也在加速商业化。

写在最后

马斯克又像过去一样开启新一场豪赌，高杠杆、高风险、高回报。xAI 如果按照基本面来分析那无疑是惨淡的，应该停止疯狂烧钱，但谁让它是马斯克的 xAI，关于未来的宏大构想似乎又可信了。

参考资料：

马斯克发布 " 地球最强 AI 模型 " 来源：CSDN

xAI 每月狂烧 10 亿美金？来源：深网腾讯新闻

马斯克曝光的 Grok 4，学会了第一性原理来源：极客公园

马斯克新发布全球最强模型含金量如何来源：第一财经

宙世代

一起剪

相关标签