雷科技 5小时前
突发!谷歌技术巨牛Noam跳槽OpenAI
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

科技圈又爆出重磅炸弹!就在今天,大模型领域的绝对巨佬、Transformer 论文的核心作者 Noam Shazeer 在社交平台上正式宣布:离开谷歌,加入 OpenAI。

(图源:X)

对于关注 AI 行业演进的朋友来说,这绝对是一次引发行业地震的重大人事变动。

很多人可能对这个名字有些陌生,但他不仅是大牛,更是如今整个生成式 AI 时代的奠基人之一。他是 2017 年那篇改变世界的封神论文《Attention Is All You Need》的共同一作。

(图源:Google Scholar)

为了让大家直观感受他在学术界和工业界的统治力,可以看看他的 Google Scholar 主页数据,总引用量高达惊人的 357394 次!

Noam Shazeer 和老东家谷歌的关系,也是一绝。

他曾是谷歌的元老级猛将,一手打造了早期的先进对话大模型 Meena,但受限于当时的大厂包袱,一气之下于 2021 年离职创办了 Character.AI。

到了 2024 年,后知后觉的谷歌砸下近 27 亿美元把他连人带团队请了回去。

(图源:Linkedin)

其实这两年谷歌在 Gemini 家族的迭代上也算是火力全开,从底层多模态到超长上下文表现都可圈可点,这里面肯定有 Noam 的功劳在。

结果如今才不到两年, Noam 转头就跳槽去了 OpenAI,果然,要走的终究是留不住啊。对谷歌来说,这波简直是赔了夫人又折兵,一口老血喷出来。

现阶段的大模型,在核心能力上已经很难拉开巨大的差异,反而是在应用端、算力端需要快速提升,因为烧 tokens 的路线在经济帐上明显算不过来。

仔细看看 Noam 今年的最新专利,这里面藏的全是大模型下一阶段演进的最核心命题:

Agent 的终极拼图:专利 Machine-Learned Language Models Which Generate Intermediate Textual Analysis in Service of Contextual Text Generation 明确提到了使用结构化工具(如 API)。这意味着它的核心不仅是内部推理,更是让大模型具备自主调用外部工具、API 的 Agent 能力。OpenAI 显然需要他来补齐打造 " 超级智能体 " 最关键的一环。

用 AI 设计 AI: 专利 Granular neural network architecture search over low-level primitives 揭示的是神经架构搜索(NAS)。这说明他不仅懂宏观设计,更在研发用算法去自动搜索和拼装比现有 Transformer 更高效的底层网络组件。

榨干算力与硬件性能:专利 Attention neural networks with conditional computation 正是大名鼎鼎的混合专家模型(MoE)核心逻辑;而另一项带有 linear units 的专利,则是通过引入元素级乘法(element-wise multiplication)来优化底层前馈网络(如业界大火的 GLU 变体)。随着模型向百万亿参数冲刺,OpenAI 极度需要他来打破算力成本的天花板。

总结来说,OpenAI 拿下 Noam,看中的是他底层构建的能力。

这场 AI 军备竞赛的最高端局,本质上依然是天才大脑的争夺战。

大家觉得 Noam 的加入,能帮 OpenAI 继续稳坐铁王座吗?欢迎在评论区聊聊你的看法!

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

谷歌 专利 google 火力全开 社交平台
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论