虎嗅APP 02-13
马斯克离不开华人骨干
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

本文来自微信公众号:字母 AI,作者:小金牙,编辑:王靖,题图来自:视觉中国

马斯克站在台上,语气比外界想象的要轻松。

他先调侃 xAI 只有两年半," 还只是个学步的孩子 ",随后一页页翻出公司成绩单:语音、图像、视频生成登顶榜单,10 万张 H100 训练集群已经建成,百万卡规模在路上,Grok 应用、Imagine、多模态产品线全面铺开。

台下不时响起掌声,但更引人注意的,是随后的组织架构图。

四大应用板块、完整基础设施分层——这是一次战时整编。

尤其是在两位华人联合创始人刚刚离开、外界普遍解读为 " 动荡期 " 的背景下,这场全员会释放的信号非常明确:xAI 只是在变革,不是在被抛弃。

更大的野心也被披露,不仅 X 要往 " 超级应用 " 的方向发展,还要发挥 SpaceX 和 xAI 合并的威力,忘记火星,剑指月球,建立地外算力设施。

十几位成员被请上台发言,其中依然不乏华人技术骨干的身影。

一、又开会又发帖

24 小时内接连两位华人联创宣布离开,xAI 经历了一次大地震。

吴宇怀(Tony Wu)和 Jimmy Ba 先后在 X 上发消息,表示将从 xAI 离职。一时间猜测的声音四起,尤其考虑到时机微妙——马斯克正在着手融合 SpacaX 与 xAI 两家公司,并可能准备上市。

据统计,光是 xAI 的 12 位联合创始人中,就已经走了 6 人。要是再加上其他近几个月离职的工程师,从 xAI 弃船的人和下饺子没两样了。

在这种情况下,向来看似没个正形的马斯克也出来积极稳定人心。

他直接开了个全员会,被媒体报道之后干脆放出了 40 分钟的完整视频,并在 X 上发帖称:

"xAI 几天前进行了重组,以提高执行速度。随着公司的发展,尤其是像 xAI 这样快速增长的公司,其组织结构也必须像任何生物体一样不断演进。

很遗憾,这意味着我们不得不与一些人分道扬镳。我们祝愿他们在未来的事业中一切顺利。"

在会议中,马斯克表达的也是这个意思。

这就很值得玩味了。

因为离职的两位联创,言语间在说是自己选择离开的。

吴宇怀直接说 " 我今天从 xAI 辞职了 ",并表示 " 是时候打开新篇章了 "" 这是一个充满无限可能的时代 "。

Jimmy Ba 则表示 " 我们正走向一个在正确工具加持下、生产力提升 100 倍的时代 "" 是时候把我在‘大局’上的梯度重新校准了 "。

而马斯克则似乎在暗示,他们的离开,是因为公司在进行一波大调整,所以才和一些人 " 分道扬镳 "。

事实如何,只有他们自己清楚了。

人才如流水,有人离开,也有人留下,在这次的全员会上,很多成员被请到台上。

二、全新架构与野心

我们先来看看这次全员会都说了什么。

首先,是 xAI 已经达成的里程碑。

马斯克强调,xAI 刚刚成立不过两年半,但是训练集群已经是 10 万张 H100 级别的规模,已经在往百万卡等效规模拓展设计,而且语音、图像、视频生成技术,均已稳居行业顶尖水平。

" 百科全书 " 式产品 Grokipedia 已经有约 600 万篇条目。

X 生态已经达到 10 亿美元年经常性收入(ARR),平台安装量超过 10 亿,月活约 6 亿,新用户日使用时长较半年前提升 55%,文章发布量增长 10 倍,阅读量增长 17 倍,下载量持续每月 50%+ 增长。

秀完肌肉,马斯克宣布 xAI 组织架构大幅调整。

新架构下有四个部分。

第一,Grok 主体 & 语音(Grok Main&Voice),也就是核心的 Grok 模型。

语音被放进来,是因为他们判断多模态交互会成为默认入口,而且已经把 Grok 语音能力铺进特斯拉汽车端(200 万辆)和 API 体系。

第二,编程(Coding)。

奔着递归自我改进去的,也就是让 Grok 写代码、调试代码、再用这些代码训练下一代 Grok。内部已经在用模型持续跑代码验证,目标是把编程效率提升 10 倍以上,甚至最终跳过源码阶段,直接生成可执行二进制。

也就是说,未来连编程语言都要被杀死了。

第三,图像与视频声称模型,Imagine。

Imagine 起步只有 6 个月,但现在用户每天生成接近 5000 万条视频。过去 30 天生成了 60 亿张图片。谷歌 30 天 10 亿张。内部节奏是每天多次产品更新、每两周一次模型更新。

未来要建立 " 可交互视觉世界 ",包括长视频生成、实时渲染、可响应用户行为的虚拟环境,本质上就是在为数字世界做底层视觉引擎。

第四,Macrohard,目标是对整个公司进行完整的数字化仿真。

这个名字有点戏谑,完全是 " 微软(Microsoft)" 的反义词,直译就是 " 巨硬 "。

这也是内部最科幻、但内部权重极高的一个板块。

这个项目要做 " 公司级 AI 模拟系统 "。通过人类行为仿真 + 工具调用,让 AI 能在电脑上完成一个公司所有数字工作,从工程设计、金融分析到客服运营。

内部判断这是长期最重要项目,因为绝大多数公司的产出本质是数字信息,一旦被模拟,就能生成完整的 AI 公司。

在这四个主要板块之外,还有若干团队做基础支持:

API 与核心产品基础设施团队;

专家导师与 Grokipedia 团队;

机器学习与数据基础设施团队(ML&Data Infra);

计算与网络基础设施团队;

物理基础设施团队。

谈起未来的伟大愿景,从收购推特后就一直在说的 " 万有应用 " 再次被摆上台面。

未来,Grok、Agent、未来的工作门户,都会直接嵌在 X 体系里运行。

X 生态还会有金融层,也就是 X Money。内部已经跑封闭测试,接下来会小范围外测再全球上线。它将包含转账、储蓄、贷款、证券、加密资产等全金融链条,而非单纯的支付交易。

此外,他们还会推出独立的通讯应用 X Chat。还是那句话,X Chat 不禁让人想到 Wechat,也就是微信。构建一个 " 超级应用 " 始终是马斯克的野心所在。

但是要说 xAI 未来最最最宏大的叙事,还要属地外算力基础设施。

这部分真正发挥了 xAI 与 SpaceX 合体的威力。

先是地面超算与数据中心,然后是近地轨道数据中心,通过 SpaceX 发射 AI 计算卫星,把训练与推理算力搬到太空。

再往后,是月球工厂加 AI 卫星制造体系,甚至包括在月球建设 " 质量驱动器(mass driver)",一种用电磁加速把卫星直接发射入轨的装置,降低火箭成本。

目标是把可用算力扩展到地球能源极限之外。

人类文明现在只使用了地球潜在能量的一小部分,而太阳能量是现有文明能耗的百万倍级别。

要利用这些能量,就必须走出地球。因此 AI 算力扩张、太空工业化、火箭与数据中心融合,本质上被视为同一件事:都是在 " 把意识之光扩展到群星 "。

三、新架构下的华人力量

可以确定的是,这波离职潮来得凶猛,马斯克已经感受到了来自外界的压力。

不仅紧急开会全秀肌肉、谈未来,全员会上除了马斯克,总共有十几位关键成员登台发言,大有 " 我们仍然有很多人才 " 之意。

其中有四位华人。

最值得关注的是张国栋(Guodong Zhang)。

张国栋本身就是 xAI 的创始成员之一,目前创始团队中 5 位华人已经走了 3 人,他是仍然坚守在这家公司的人之一。

他在 xAI 主要负责机器学习优化与训练工作,此前其所在团队致力于构建人工通用智能(AGI)并开源大模型 Grok 系列。

随着吴宇怀离职,张国栋在负责预训练的同时,还接手了后训练工作,包括此前向吴宇怀汇报的部分团队。

在这次全员会上,张国栋被正式确定为 Imagine 的负责人,以及 " 编程 " 团队的核心人员。

张国栋本科就读于浙江大学信息工程专业,后于多伦多大学拿到机器学习方向博士学位,在作为联创加入 xAI 之前,他已经在谷歌大脑、谷歌 DeepMind 积攒了多年经验。

他博士阶段以及之后的研究,长期集中在大模型如何被更稳定、更高效地训练出来这件事上,比如最优化博弈(minimax optimization)、自然梯度、权重衰减机制、SGD 噪声结构、训练收敛性等问题,这些都属于 " 模型为什么能训成 "" 怎么训更好 " 的底层科学问题。

他的研究和工作本质围绕一个问题展开:当模型规模越来越大时,训练过程的数学结构与稳定性如何被控制。

Imagine 聚焦多模态生成与理解,本质仍依赖大模型训练、强化学习与推理体系能力,这正是他的核心专长。同时他仍是 Coding 团队关键成员,因为代码生成被视为模型自我进化与效率放大的核心场景。

在张国栋负责的 Imagine 团队,还有一位华人核心成员刘昊天(Haotian Liu,音译)。

刘昊天也是浙江大学校友,后于美国威斯康星大学麦迪逊分校拿到计算机科学博士学位。

他参与的 LLaVA 系列、视觉指令对齐、图像-文本对齐改进等工作,在多模态模型发展里是比较有代表性的路线之一,属于把大模型能力往视觉世界扩展的关键一环。

公开学术索引里,他参与的研究工作累计已有数千级引用量,覆盖视觉识别、生成数据评测、多模态代理等方向。

也难怪他会作为 Imagine 核心成员上台,因为他的研究路线,本来就在往视频→世界→模拟现实这条终局路径上走。

在四大核心团队之外,基础支持团队中上台发言的成员也包含两位华人。

一位是郑怜悯(Lianmin Zheng),一位是刘云龙(Yunlong Liu,音译),他们现在都是 xAI 机器学习与数据基础设施团队(ML&Data Infra)的核心成员。

郑怜悯本科就读于上海交通大学,他的主要研究领域为机器学习和编程系统的交叉,特别是用于高性能大规模深度学习的领域专用编译器。

在加入 xAI 之前,他曾在亚马逊实习,还曾经获得过 2022 年 Meta 的博士研究奖学金,当时一共有来自全球 100 多所顶尖名校的 2300 多位优秀博士生申请该奖学金,最终有 37 名入选,郑怜悯就是其中之一。

刘云龙则是清华大学校友,最终拿到了约翰 · 霍普金斯大学计算生物物理学的博士学位。

在 xAI 这次全员会上,他对应的就是 JAX 训练栈这一块。

他提到团队规模很小,但要支撑从预训练、基础模型到强化学习、多模态模型的全部训练任务,而且算力规模要从 1 万卡扩展到 10 万卡,再到 100 万张 H100 等效 GPU。

这背后就是他们在做的事情:把原本偏研究框架性质的 JAX,改造成能跑在超大规模工业级超算集群上的训练基础设施,需要从编译器、运行时、并行策略到通信路径全部重写和定制。

xAI 和 SpaceX 合并后,马斯克要下一盘大棋,目前的人员流失究竟是重大的打击,还是必经的阵痛,还要时间来检验。

很明显的是,新 xAI 现在很缺人。

不管是马斯克,还是上台发言的成员,都在一遍一遍地喊话——欢迎加入我们的团队。

本文来自微信公众号:字母 AI,作者:小金牙,编辑:王靖

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

马斯克 王靖 离职 联创 成绩单
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论