刚刚,大神Karpathy宣布新动向:加入Anthropic。

此次重回一线大厂,原因是 " 未来几年会是大模型前沿发展尤为关键的阶段 "。
Karpathy 在 2024 年再度离开 OpenAI,创办了自己的 AI 教育公司 Eureka Labs。
而在过去一两年中,他也作为一个独立于顶尖大模型实验室之外的「自由人」,给关注 AI 领域的大家伙带来了不少新鲜视角——
从 Vibe Coding 到 Agentic Engineering,这些关键词都因为他的引出,在更大范围内被讨论和深挖。
消息指出,Karpathy 将加入 Anthropic 的预训练团队,帮助启动一个用 Claude 自己加速自身预训练研究的新小组。
Andrej Karpathy 可以说是大模型领域当下最知名的意见领袖之一。
他博士毕业于斯坦福大学,师从李飞飞,主要研究自然语言处理和计算机视觉的交叉点。
博士毕业后,他成了 OpenAI 的创始成员。后来被 OpenAI 创办者马斯克看中,亲自 " 拐 " 到了特斯拉,担任自动驾驶负责人……直到 2022 年 FSD 突破后离开。
2023 年,在 ChatGPT 点燃新时代的烽烟之际,他又重回 OpenAI,负责组建 midtraining 和 synthetic data generation 团队。
当时,他给出的理由与这次加盟 Anthropic,亦有共通之处,即看到了技术发展的潜力与趋势,要深入一线参与构建。

但这一次回归,Karpathy 只待了一年。尽管他本人否认离开与 OpenAI 的内斗大戏有关,只是想 " 投身个人项目 ",但外界依然不免揣测。
根据 Axios 爆料,Karpathy 此次加盟 OpenAI 劲敌 Anthropic,将致力于研究用 Claude 本身来加速预训练。
这正是他最近颇为关注的 agentic engineering 的一环:
AI 不只能写业务代码,也开始参与更上游的模型研究、实验设计、代码生成、训练分析、数据管线、评估和调参。
无疑,相比与继续当一个独立「自由人」,加入顶级实验室,能够为他接下来的研究提供更丰富的一线视野和资源。
龙虾之父 Peter Steinberger,不也是入职 OpenAI,才能月烧 940 万元 token 的嘛(doge)。
一键三连「点赞」「转发」「小心心」
欢迎在评论区留下你的想法!
— 完 —
点亮星标
科技前沿进展每日见


