雷锋网 前天
PPIO创始人姚欣:闲置率高达八成的国产GPU,如何盘活成“真算力”?
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

作者 | 赵之齐

编辑 | 包永刚

2018 年,边缘算力与 CDN(内容分发网络)市场已白热化,价格卷到极致。就在这一年,PPIO 成立了。他们毅然切入边缘云领域,直面红海的竞争。

当时,创始人姚欣给天使投资人——百川智能创始人王小川、前微软 Azure 中国总裁申元庆——讲的创业逻辑是:

"当年 PPTV 就是整合闲置的算力和资源,建起来的一套分布式平台。我们二十年前就在做 C 端的算力整合,现在要去做 B 端,你想,是整合 B 端难还是 C 端难?"

在 2005 年便创立了 PPTV、并在 2014 年将其出售给苏宁的姚欣,与当时 PPTV 的首席架构师王闻宇转战 B 端算力领域,显然是值得被信任的。于是,这个故事被投资者们接受了。

然而,这一路的起步并不如想象中容易。起初,PPIO 在 " 先找供给 " 还是 " 先找需求 " 间久久徘徊,商业难以闭环,直到疫情导致线上流量激增,才逐渐跑通了这一增长曲线。

2023 年,当疫情带来的线上流量红利逐渐消退,GPU 市场也开始利润暴涨,H100 的高点价格甚至一度达到 400 万元。GPU 贸易赛道火热之时,姚欣却拒绝了这门 " 稳赚不赔 " 的生意,在那个基础大模型训练正盛的年代,提出了要 " 聚焦推理 "。

PPIO 联合创始人兼 CEO 姚欣

如今,短短几年时间,PPIO 的营收已经实现指数级增长,2024 年营收已达 5.58 亿。而在今年 7 月的 WAIC(世界人工智能大会),PPIO 又成了国内首个推出兼容 E2B 的 Agent 沙箱的公司——

Agent 沙箱作为专为 AI Agent 场景设计的基础设施,能为 AI Agent 提供隔离运行环境,让 Agent 在安全、受限的条件下执行代码。由此,防止 Agent 访问或篡改系统之外的资源,避免对系统造成损害。

在整个研发过程中,姚欣感慨,最难的便是 " 为看不见的需求做技术 "。

而这,也是 PPIO 这两年一直在做的事——比行业走快一步。

如今,PPIO 正在冲刺港股 IPO。从边缘云到 GPU 推理平台,再到 Agent 沙箱,PPIO 成为了具备全栈技术能力的 AI 云服务商,这些跨度背后是如何考量?在国内云大厂夹击下,作为创业公司的他们如何突围?

以下,是雷峰网与姚欣的对话。

为看不见的需求做技术

雷峰网:你们从 2018 年创立做云服务,起初的算力做到现在的沙箱,跨度很大,这条路是怎么走下来的?

姚欣:我们 2022 年开始进入 GPU 领域,当时 AI 大语言模型还没开始,最开始做的是云游戏和云渲染的 GPU,这天生就是一个分布式架构。

2023 年大语言模型起来后,整个市场开始起来。当时国内某头部模型厂商发布了自己的开源模型,但缺少推理平台,我们就帮着他们在 2023 年搭建了第一代推理平台服务,这是我们的第一个推理的 Infra 客户。

2024 年,PPIO 就开始在重点聚焦出海,集成了大量开源的模型,把模型 API 推出一整套 MaaS 平台。

今年年初,PPIO 再往上走一层,Agent 其实就类似于 PaaS 层,相当于我们从底层技术栈一层层长上来。

雷峰网:在这之中,挑战主要是什么?

姚欣:最大的挑战就是,我们是为看不见的需求在做技术。

做 AI Infra 或技术平台现在看起来已经普及了,但在 2024 年做 MaaS、或者现在做 AI PaaS Agent,用黄仁勋的话讲,就是"Zero/Billion dollar company market",一个零 / 亿市场,现在是 0,也许以后就是 10 亿、20 亿、百亿。要为一个今天还是 0 的市场,提前做技术储备、研发、投入;但如果看到 Manus 起来后再开始做沙箱,其实就已经晚了。

雷峰网:在 2022 年决定切入做算力云的时候,内部是怎么去讨论这个市场的?

姚欣:当时还没看到 GPT,我们更多是从公司要打造第二增长曲线的角度。

在此之前我们第一增长曲线是基于 CPU 做的边缘云,那会儿主要是抓住了疫情期间在线流量激增带来的业务需求。我们当时为很多头部互联网公司提供音视频处理、边缘计算和传输服务,都是基于传统 CPU 和云架构。2022 年疫情逐渐结束了,流量慢慢回落,我们就意识到要开始找第二增长曲线了。

雷峰网:但如何锚定现在这个方向的呢?

姚欣:我们作为云服务商,其实大的思路就是计算、存储、传输。半年后,ChatGPT 开始风靡,国内掀起大模型创业热潮,看到大模型类企业快速融资、扩张的态势,我们就明确将第二增长曲线定位为 AI 赛道做 AI Infra,从 GPU 层逐步向上构建到今天的 PaaS。

雷峰网:当时很多人都想做算力贸易生意,你们是怎么决定要去做分布式算力的路线?

姚欣:我们选择避过热点,没有参与任何倒算力囤卡,这跟整个公司的价值观都有关系——我们价值观第一条叫 " 价值创造 ",一定要做有技术附加值的东西。

我们在 GPU 领域的商业模式是整合汇聚大量闲置的分布式算力,再把它变成某种云服务。我们技术附加值的体现,主要就是把闲置算力 token 化

雷峰网:你们是怎么找到这些闲散资源的呢?这些资源的持有方会是谁?

姚欣:2022 年看到的都是游戏显卡,用4090、3090做渲染,甚至最开始 Stable Diffusion 就在 4090 上面跑的。后来看到上一代训练的 GPU 大量闲置,例如 2024 年大家都开始拿 H100 做训练,A100 被替换,我们就拿闲置的 A100 来跑推理。

再往后又看到很多国产 GPU用不起来,有的国产 GPU 智算中心利用率只有 10%-20%,我们就又开始做国产 GPU 和模型推理加速框架的适配。今年我们平台上就有很多头部厂商的国产 GPU。

雷峰网:所以你们一方面是用那些已经被时代选择淘汰了的算力,另一方面是国产算力,而且对标推理市场,没有去碰算力训练这一块。

姚欣:对,因为训练和推理的任务指标不一样。一个模型比别人先推出是很重要的,所以训练永远用最先进的芯片;但推理不一样,推理要求极致的成本性价比,结合我们独特的分布式闲置资源整合的能力,降低创业者使用算力门槛。

不绑定 + 开源:AI 开发者的 " 反锁定 " 需求

雷峰网:PPIO 在 WAIC 上发布了沙箱,似乎是国内首发的 Agent 沙箱。为什么会在这个时间点上去推呢?

姚欣:要加一个补充,这是我们 " 在中国 " 首发 E2B 兼容的 Agent 沙箱,在海外已经提前发布了。

我们在 2023 年选择出海,在海外优先寻找一些战略客户或早期的新技术,和他们一起快速打磨和迭代,推动底层 AI Infra 开发技术栈的创新。

雷峰网:现在沙箱进展如何?

姚欣:目前我们在海外落地比国内快一些,PPIO 推沙箱对标海外 E2B,他们在硅谷今年一年用量大概涨了 400 多倍,从 4 万多到 1600 多万。国内过去的模型合作伙伴像是千问、Kimi、智谱等等,这几家模型能力基本可以追平年初的 Anthropic,所以我判断未来几个月中国版的 Manus 或 Cursor 可能会更快速增长。

雷峰网:在你们推出沙箱后,大厂也在跟进了,会担心和大厂之间的竞争吗?你们和大厂的差异性在哪里?

姚欣:从我创办第一天,投资人就开始问我们这个问题,但现在到了 Agent 或 PaaS 这一层,话题就开始有趣起来了。

之前做云计算,在 IaaS 层,说白了就是拼资源、拼规模,是一个 Heavy Capex(资本性支出)的游戏。到 PaaS 层,虽然巨头影响力还是巨大的,因为他们原来的客户积累和生态依然是最强的,但到了 Agent Infra 这一层,云大厂的影响力和 PC 以及移动时代相比,是大幅削弱的。

雷峰网:为什么有这个观察?

姚欣:具体是以下这几个原因。

第一,GPU 的 Infra 架构是在过去三年时间里突然冒出来的,不像 CPU 有将近 20 年发展,所以大厂很难有很明显的先发优势或很强技术积累,今天大厂真正做沙箱这件事,跟 PPIO 可能也在差不多一个体量。

第二,这波 AI 成本太高,所以各家公司包括开发者,第一天设计自己的架构时就是跨云、多云或者可以灵活调用的架构,追求一整套标准化的接口,不会跟某家厂商特别绑定。我们就把 API 能力做好,作为一个组件;与此同时,也拥抱开源。

这代 AI 开发者不像上个时代的移动互联网开发者,选择某个云后就在上面越存越多,慢慢配套一堆私有化的组件调用、或者专有组件调用,牢牢被它绑住了。我们在国内和差不多四五十款主流的开源框架有对接合作,而且也没有想把 GPU 和 CPU 绑在一起销售,就是想基于开源和可迁移性去方便开发者

雷峰网:所以现在的沙箱主要目标市场就都是开发者吗?

姚欣:其实不光是沙箱,包括提供的 API、很多 GPU 的 Serverless 等等,我们过去两年主要都是为了 AI Startup 和开发者两个人群提供服务。

雷峰网:这个群体的市场足够大吗?

姚欣:这些开发者和新应用,在用量侧其实比很多传统互联网巨头高很多。前段时间 Sam Altman 也说了,Open AI 的 Top20 消耗里,70% 以上都是 AI 新应用,我们想争取这种全新增量用户。

而且过去几年有个特点,新的 AI 创业公司和应用公司出来,他们做一件事的 token 消耗,可能比上个应用直接提升 10 倍甚至 100 倍。比如 Manus 执行一个任务,调用的 token 可能是几十万次 .

今年 7 月,Manus 还发布了个 Wide Research,一个任务同时开 100 个 Agent 在跑,这 100 个 Agent 同时得出一个结果、最后返回一个最佳解,这个消耗量就相当于再增长 100 倍。

AI 赌的是下一代

雷峰网:你认为分布式算力厂商的优势在哪里?

姚欣:第一是节点数量要足够多、任务需求也要多。我们的优势在于技术栈和传统云公司完全不一样:我们从第一天就是在分散、碎片、异构的基础设施上建立起来的云服务,所以叫 " 分布式云 ",但传统大云厂的技术栈,是建立在集中式、大规模标准的数据中心上做的虚拟化加技术栈。

很多企业级算力也是用这种方式整合起来。有些互联网企业,比如做电商的,旺季在双十一、618,但上半年利用率其实很低,周一到周五还会比周末低,他们就很需要在闲置时把这些资源用起来。

雷峰网:目前 PPIO 有 4000 多个节点,这些节点是如何分布的?

姚欣:这些节点很多是零售型 IDC,他们随时可以把机器在闲置期内托管到我们平台上供调用,相当于有这么多 " 滴滴司机 " 随时待命,但不代表他们 24 小时都在服务。

真正要调用时,就要看客户场景,有的应用场景追求低延时,会就近调用;有些比较成本敏感,就可以比如给北京的用户调新疆的资源——新疆电费是北京的 1/3,甚至全球范围内,东半球的白天是西半球的凌晨,可以跨更大的区域调度。

雷峰网:最开始分布式算力云的客户也是这些开发者相关吗?

姚欣:不是,分布式 CPU 云是头部的互联网那个公司。但到了 GPU 云时代,主要是以 AI 创业者和开发者为主。

雷峰网:为什么有这套策略的转变?

姚欣:我们现在更想和客户一起联合打磨未来新产品,所以选择开发者和 AI 创业公司, AI 时代不一样,AI 是赌下一代,下一个字节、下一个抖音在哪里?现在还没有出来。

雷峰网:那未来对分布式算力的挑战会在哪里?

姚欣:还是在需求侧,技术侧和供给侧不担心,就看需求侧什么时候能有大规模爆发,尤其是重视时延敏感的需求。

创业成果是认知的变现

雷峰网:听起来是 2020 年疫情需求起来后,边缘 CPU 才真正利用起来。但你们在 2018 年就已经开始做这个业务,最开始遇到了什么挑战?

姚欣:最早的挑战就是 " 鸡生蛋 " 还是 " 蛋生鸡 " 的问题,或者说,所有平台生意的第一点都是:先抓供给还是先抓需求。

抓需求吧,大家说你技术不成熟、网络覆盖广度不够、没有全国节点;但是到处找全国节点,大家就会问你需求呢?

当年这个平台能冷启动,很大原因是 2020 年疫情爆发,需求超出预期,我们才能有技术打磨、锁定更多供应商。到今天 GPU 这张网络也是类似的,过去一年我们平台 token 消耗增长了一百倍以上,推理时代这种极其陡峭的高增长曲线才能把 GPU 网络拉起来,所以我们现在也在找下一个更高增长爆发的新需求。

雷峰网:那当时 PPIO 成立,在 CDN 红海里做边缘云,是怎么说服王小川、申元庆等人投资的?毕竟他们都是很懂云的人。

姚欣:2018 年,第一波 AI 计算机视觉很热,有大量算力需求、也有很多算力被闲置,尤其很多数字新基建 IDC,建完没用起来。我跟他们讲的故事很简单:我们二十年前就在做 C 端的算力整合(指 PPTV),现在要去做 B 端的算力整合,你们想想是整合 B 端难还是 C 端难?

技术上肯定是 C 端更难更复杂,商业模式上 B 端也可能更成熟一些,后来这个故事大家就听到了,觉得我们团队是做 PPTV 分布式计算、分布式网络出身,调度能力足够强。

雷峰网:现在回头看,在 PPIO 创业的过程中,您觉得自己做得很对的一个判断是什么?

姚欣:2023 年我们就提出聚焦推理、聚焦开源、海外优先,这个认知当时比同行要早很多,当时开源模型还没几个。现在能抓住这波 DeepSeek 机会、以及海外这么多知名开发者,和三年前这个判断非常关键。我们在整个战略趋势和方向的判断上,还是比当年做 PPTV 强太多。

雷峰网:回头看,您感觉创业重要的能力是什么样的?

姚欣:我觉得最重要的就是认知能力,如何不断学习、快速适应,并不断提升认知能力的上限。我们公司是动漫文化,我是海贼王路飞,海贼王里有恶魔果实,如果选一个果实,我最想吃的是学习果实,因为对于一个创始人来讲,最重要的就是认知能力,包括我做投资人的三四年里来看,最后的成果都是认知变现。

这二十年间,技术的发展也经历过多个周期,我很清楚下一个周期要发生什么,加上我总是到处飞,去看最先进的模型和技术生态、跟全球最新锐的创业者在一起,我们对技术和商业的结合、对全栈的理解可能会比业内其他竞争对手更快更强。

雷峰网:那现在会有什么新的判断吗?

姚欣:Agent Infra 会是下一代的 AIOS。

作者长期关注半导体、算力上下游等方向,欢迎添加作者微信 Ericazhao23 交流。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

gpu 创始人 ai
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论