年费最高超2万元！20万GPU训出Grok 4，马斯克的“野心”被质疑，木头姐：20万亿美元蛋糕正被xAI和OpenAI等瓜分

当地时间 7 月 9 日，马斯克旗下 xAI 的下一代大模型 Grok 4 系列正式发布。

马斯克在发布会上强调，Grok 4 是目前世界上最聪明的 AI。他还称，Grok 4 在所有学科上都超越了博士水平，没有例外。不过，Grok 4 的订阅费相当昂贵，最高达 3000 美元 / 年（约合人民币 21530 元）。

大模型性能评估平台 Artificial Analysis 的全套基准测试成绩表明，Grok 4 已经成为当前领先的 AI 模型，总成绩达到了 73 分，领先于 o3、Gemini 2.5 Pro、Claude 4 Opus 等模型。

但马斯克对于 Grok 4 的野心远不止于此，他此前表示，要用具有高级推理能力的 Grok 4 重写人类知识库，补充缺失的内容，纠正错误的知识，再基于新的 " 干净而准确 " 的知识库重新训练 AI。不过，这一说法也遭到了业界人士的质疑。

被称为 " 木头姐 " 的凯西 · 伍德（Cathie Wood）表示，Grok 虽然起步较晚，但在性能上很快追赶上 o3 pro 等头部模型，这得益于训练集群的合理布局。在 Grok 4 亮相前一周，xAI 刚刚完成新一轮百亿美元融资。截至目前，xAI 累计融资额已超过 200 亿美元。

图片来源：xAI 直播发布会截图

" 世界最强 AI"，年费最高达 3000 美元

当地时间 7 月 9 日，原定于太平洋时间晚上 8 点的 Grok 4 线上发布会，延迟了几乎整整一小时。发布会开始不久，马斯克便高调宣称，" 这（Grok 4）是世界上最强的 AI"。

他强调，Grok 4 在所有主要学科上的表现都已超越博士水平。虽然它目前尚不具备发明新理论或提出原创技术的能力，但马斯克认为，这只是时间问题。他大胆预言，Grok 有望在今年年底具备发明新技术的能力，到明年则几乎能够拥有发现新物理规律的实力。

据介绍，本次发布的 Grok 4 系列模型包括 Grok 4 和 Grok 4 Heavy 两个版本，均为推理模型。其中，Grok 4 为单智能体模型，而Grok 4 Heavy 为多智能体版本，支持多个智能体并行思考，能够调用更大规模的计算资源以完成更复杂、更精密的任务。

大模型性能评估平台 Artificial Analysis 的全套基准测试成绩表明，Grok 4 已经成为当前领先的 AI 大模型，总成绩达到了 73 分，领先于 o3-pro、Gemini 2.5 Pro 等模型。

图片来源：Artificial Analysis

此外，在 " 人类终极考试 "（HLE，Humanity's Last Exam）中，Grok 4 系列模型也取得了亮眼的成绩。最新版 " 人类终极考试 " 包含 2500 道专家级难度的问题，涵盖数学、物理等多个领域。

据 xAI 介绍，今年早些时候，大多数模型在该测试中的准确率得分在 10% 以下。而 Grok 4 在不使用任何工具的情况下，得分为 25.4%，超过了 Gemini 2.5 Pro 的 21.6% 和 o3 的 21%。若使用工具，Grok 4 的成绩进一步提升至 38.6%，Grok 4 Heavy 的成绩更是达到了 44.4%，几乎是 Gemini 2.5 Pro 的两倍。

图片来源：xAI 直播截图

除了 " 人类终极考试 "，Grok 4 和 Grok 4 Heavy 在其他基准测试中同样表现突出。Grok 4 系列在 GPQA 测试中得分均接近 90%，在 AIME25 数学竞赛题上，Grok 4 Heavy 更是取得了满分的成绩。

在以高难度著称的 ARC-AGI 通用人工智能测试中，Grok 4 在 v2 Semi Private 挑战中获得 15.9% 的分数，几乎是第二名 Claude Opus 4 得分的两倍。

除了在基准测试上表现亮眼外，Grok 4 语音能力也得到了增强。据介绍，Grok 4 的语音模式相较于上一代，端到端的延迟更低，还支持五种音色。

目前，Grok 4 已经上线，不过需要付费使用，且订阅费相当昂贵。据 xAI 官网，付费模式分为年付和月付两种。Grok 4 的订阅年费为 300 美元（约合人民币 2153 元），而要想使用更强大的 Grok 4 Heavy 版本，则需要订阅 SuperGrok Heavy 套餐，年费高达 3000 美元（约合人民币 21530 元）。

图片来源：xAI 官网

下一步，xAI 预计还将发布代码模型、多模态智能体以及视频生成模型。

马斯克宣称 Grok 4 将 " 重写人类知识库 " 被质疑

Grok   4 的推出伴随着不小的争议。直播前夕，Grok   3 曾因传播不当言论引发外界批评。有声音认为，xAI 若不能在未来几周内提供更具结构性的模型安全机制，并公布更透明的训练方式，Grok   4 或很难摆脱 " 高性能之下的高风险 "。

对此，马斯克强调，Grok   4 的目标是 " 成为尽可能追求真相的 AI"。

在马斯克看来，许多模型的训练数据本身就充斥着错误与垃圾信息。他此前宣称，要用具有高级推理能力的 Grok 4 重写人类知识库，补充缺失的内容，纠正错误的知识，再基于新的 " 干净而准确 " 的知识库重新训练 AI。

图片来源：X

不过，有观点指出，马斯克正试图打造一个能够体现自己观点的模型。Cohere 联合创始人尼克 · 弗罗斯特（Nick Frosst）直言，" 他（马斯克）正努力打造一个反映其个人信念的模型。这肯定会让模型对用户来说更差，除非用户恰好认同他的所有信念，且只希望模型复述这些内容。"

从技术层面看，马斯克的构想或同样存在一些问题。谷歌 DeepMind 研究副总裁奥里奥尔 · 文亚尔斯（Oriol Vinyals）指出，如果从训练数据中剔除所有错误，模型可能会丧失检测和修复新错误的能力。

累计融资 200 亿美元！" 木头姐 "：xAI 有望脱颖而出

尽管外界频有争议，但资本市场却给出了一些积极的反馈。

作为业内头号马斯克 " 铁粉 " 的网红基金经理、有着 " 木头姐 " 之称的凯西 · 伍德（Cathie Wood）在最新一期播客节目中表示，Grok 虽然起步较晚，但在性能上很快追赶上 o3 pro 等头部模型，这得益于训练集群的合理布局，确保了训练的高效。

据悉，Grok 4 的整个训练过程就动用了全球最大的 AI 训练农场 " 巨像 " 超算集群，20 万个 GPU 一起开工。

而且，Grok 4 发布的前一周，xAI 又完成了百亿美元融资。目前，xAI 累计融资额已超过 200 亿美元。4 月底有报道称，xAI 控股公司正在与投资者洽谈，计划为其整合后的 xAI 及社交媒体业务 X 平台筹集约 200 亿美元资金。若交易达成，该公司估值将突破 1200 亿美元。

充裕的资金也为 xAI 的算力布局提供了坚实保障。xAI 在田纳西州孟菲斯建成的超算集群 " 巨像 "（Colossus）已经部署了 20 万块 GPU，硬件成本高达 70 亿美元，功耗达 300 兆瓦，相当于 25 万户家庭的用电量。此外，xAI 还计划建一个拥有 100 万块 GPU 的新设施。

凯西 · 伍德称，AI 基础模型及相关市场规模庞大，而 xAI 有望在这一领域脱颖而出。她指出，借助星链等渠道，xAI 获得了强大的分发优势。而随着 xAI 旗下模型持续迭代，X 平台的信息价值也将同步提升。X 可被视为一个以揭示真相为目标的信息平台，而 xAI 则专注于通过 AI 技术揭示真相。两者的协同合作，能让 xAI 触达更广泛的用户群体，进而形成数据优势。"

方舟投资认为，基础模型的企业市场规模将达到 15 万亿到 20 万亿美元。目前，该公司投资了 xAI、OpenAI 和 Anthropic。凯西 · 伍德表示，他们相信，这三家公司在技术上处于领先地位，虽然未来可能会涌现更多专注于不同领域的语言模型并做得更好，但这三家公司目前仍具有显著的竞争优势。

每日经济新闻

宙世代

一起剪

相关标签