量子位 02-08
教科书《性能之巅》作者入职OpenAI!迷弟总裁亲自欢迎
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

系统性能优化领域顶级专家Brendan Gregg,正式官宣加入 OpenAI。

入职后,他将加入ChatGPT 性能团队,在澳大利亚远程办公,向团队负责人 Justin Becker 汇报工作。

Brendan 被技术圈尊称为" 性能之神 ",他的到来,受到了 OpenAI 总裁 Brockman 的亲自欢迎。

Brockman 甚至表示,自己就是 Brendan 多年以来的老粉丝。

Brendan 有多牛?

他的代表著作《性能之巅》,长期被全球高校和科技巨头列为性能工程的必读教材。

他还发明了著名的火焰图(Flame Graphs),让程序员能像看热力图一样直观地看到 CPU 在忙什么。

同时他还是 Linux 内核核心技术eBPF的主要推动者,一手构建了现代云计算的性能分析工具箱……

网友们评价,Brendan 的这些作品绝对是 next level。

那么,这样一位技术大佬,为何在此时选择了 OpenAI 呢?他本人用一篇博客讲解了自己的看法和观察。

Brendan 博客自述入职理由

Brendan 刚进 OpenAI,就给自己定了个死规矩。

Do anything, do it at scale, and do it today.

做任何事,都有规模化地做,并且就在今天做。

这是一种随时准备应战的状态。在他看来,在这个行业里,优化这件事就是要追求快,必须得在当天就在成千上万台机器上跑起来,还得立马见效。

这种对速度和规模的硬性要求,逼着他必须时刻盯着那些庞大的算力集群,哪怕能在缝隙里抠出一点点效率,也得马上动手,绝不拖泥带水。

而 OpenAI" 没禁区 " 的环境,正好给他提供了折腾的空间——在 OpenAI,只要能把性能提上去,没有任何领域被认为难以改变。

当然除了看到 OpenAI 是个大舞台之外,Brendan 还发现,AI 这个行业,也迫切需要他的参与。

让他产生这种想法的,是生活里的一件真事儿。

他发现理发师、房地产经纪人、税务会计师、兼职养蜂人等各种职业的人都在跟他聊 ChatGPT,这让他意识到,AI 已经成了普通人每天都在用的工具,背后的流量肯定大得吓人,对后台的压力已经增加了一个量级。

面对这么大的流量,以前在通用计算时代用的那些老办法,现在确实不灵了。过去几十年,大家习惯盯着 CPU 和数据库调优,手里拿的都是旧时代的锤子,但现在面对的是数万张 GPU 堆出来的超级集群和复杂的神经网络。

旧工具箱里的工具修不了新机器,面对大模型训练这种新物种,就必须得把以前的经验先放一边,重新搞一套专门针对大模型的工程方法。

这也是他干脆利落地离开干了半辈子的通用云计算领域,一头扎进 AI 基础设施这块硬骨头的原因。

他要干的事情特别具体,就是去解决 ChatGPT 背后的性能瓶颈,保证这台昂贵的机器在全球人都在用的时候,还能转得飞快。

谁是 Brendan?

那么,Brendan 究竟是怎样一位传奇人物?

可以说,他是现代系统性能领域的 " 定海神针 "。他写的《性能之巅》和《BPF Performance Tools》,在后端或者运维领域家喻户晓。

这两本大作被全球技术圈奉为圭臬,专门用来解决那些最棘手的系统瓶颈,是排查问题时的标准参考答案和 " 最后救命稻草 "。

写出这两部大作的 Brendan,是一位在极端实战环境中磨练出来的老兵。

早年(2001-2014 年)在 Sun Microsystems 和 Joyent 任职的十几年里,他就已经是DTraceToolkit的核心开发者,那时候就已经奠定了自己在动态追踪领域的元老地位。

到了中期(2014-2022 年),他转战 Netflix 担任高级性能架构师。

那时候的 Netflix 正面临着全球最大的云端架构挑战,他每天面对的是海量的并发请求和极其复杂的微服务架构,处理的都是那种在普通规模下根本遇不到的性能怪题。

而在加入 OpenAI 之前的近期,他成为了 Intel Fellow。

在这个硬件巨头的顶层技术岗位上,他专注于解决一个长期痛点——如何让软件工程师能看懂硬件 PMU(性能监控单元)传回来的底层数据。

除了著作和履历,他还是一个整个行业分析方法的发明家。

他的发明中最具代表性的作品之一就是文章开头提到的火焰图

在此之前,分析 CPU 热点只能盯着成千上万行枯燥的文本堆栈看,效率极低。

他硬是将这些数据转化成了直观的、可视化的交互式图谱,哪里是性能瓶颈,一眼就能定点清除。

这还不够,为了对比版本更新前后的性能差异,他又衍生出了差分火焰图

除了盯着 CPU 忙什么,他还特别推广了Off-CPU 分析方法论,专门去抓那些因为 I/O 等待而导致进程 " 磨洋工 " 的隐形杀手,彻底填补了传统分析中的盲区。

此外,Linux 生态里现在最标准化的bcc 和 bpftrace工具集,也是他在长期维护和贡献。

他还开发了延迟热力图(Latency Heatmaps)用来揭示平均值掩盖下的长尾抖动,以及那个专门给晕头转向的排查者指路的USE 方法(利用率、饱和度、错误)。

总之,Brendan 把 " 系统诊断 " 这门玄学变成了有章可循的科学。USENIX LISA 给他颁发杰出成就奖,就是对他这些年实战成果最权威的盖章认证。

One More Thing

Brendan 在博客中提到,他选择加入 OpenAI,还有一个私人的情结——圆梦。

小时候他是英剧《Blake ’ s 7》的死忠粉,对里面那台叫 Orac 的超级计算机特别着迷。Orac 能控制宇宙里的其他电脑,但是脾气特别臭,动不动就怼人。

上大学时,Brendan 就想自己手搓一台 Orac,但是那时候的硬件实在太拉垮,内存连个完整字典都存不下,被电脑销售嘲笑了一通后,这件事也就黄了。

直到遇上了 ChatGPT。他发现这玩意儿简直就是活生生的 Orac。

他甚至专门改了 ChatGPT 的自定义指令,让它模仿 Orac 那种 " 只有原始人才会问这种蠢问题 " 的傲娇语气跟自己对话。

对现在的他来说,加入 OpenAI,其实就是亲手把童年那个遥不可及的科幻梦给续上了。

参考链接:

https://www.brendangregg.com/blog/2026-02-07/why-i-joined-openai.html

—  欢迎 AI 产品从业者共建  

「AI 产品知识库」是量子位智库基于长期产品库追踪和用户行为数据推出的飞书知识库,旨在成为 AI 行业从业者、投资者、研究者的核心信息枢纽与决策支持平台。

一键关注 点亮星标

科技前沿进展每日见

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

程序员 远程办公 科技巨头 linux 核心技术
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论