智东西 09-02
躺在风口上的硅谷教授!身家180亿不离讲台,捧出7家AI创企
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

智东西

作者 | 陈骏达

编辑 | 云鹏

这位拥有 25 亿美元(约合人民币 179 亿元)身家的大学教授,为何还坚守在一线课堂?

智东西 9 月 2 日报道,近日,AI 数据平台 Databricks 在最新一轮融资后,估值突破 1000 亿美元(约合人民币 7162 亿元),有望成为全球估值第四高的 AI 独角兽,这也让外界关注到其联合创始人兼董事长、加州大学伯克利分校(后简称 UCB)教授 Ion Stoica,以及他横跨产业与学术界的传奇经历。

Stoica 现年 60 岁,自 2000 年起开始在 UCB 任教,此后 25 年来均未离开这一校园。2010 年至今,Stoica 在 UCB 计算机学院参与了 3 所重要实验室的创办和管理。这些实验室在大数据、云计算和 AI 时代贡献了 118 个科研项目,其中不乏影响力广泛、几乎成为 AI 领域核心基础设施的项目,如大数据框架 Spark、分布式执行框架 Ray、大模型推理框架 vLLM 等。

Ion Stoica(图源:YouTube)

他还通过亲自参与创业、指导创业或是提供人脉与资金支持的方式,创办或孵化了至少 7 家知名创企,分布于数据基础设施、生成式 AI 等行业。

除了估值已经突破 1000 亿美元的 Databricks,Stoica 联合创办了估值 10 亿美元的 AI 托管计算平台 Anyscale、估值 6 亿美元的 LMArena(大模型竞技场)和估值 3 亿美元的视频流分析技术公司 Conviva 等企业。

Stoica 是高性能 AI 与数据分析平台 Alluxio 创始人李浩源、数据中心操作系统创企 Mesosphere 创始人 Benjamin Hindman 的博士生导师,这两家创企均发源于开源项目,曾得到 Stoica 的指导。目前,Stoica 还在大模型记忆技术创企 Letta 担任顾问。

尽管取得了商业上的成功,但 Stoica 仍然心系教育、科研。今年秋天,Stoica 将继续留在课堂,教授操作系统和系统编程的本科课程。

通过在硅谷的人脉,Stoica 给自己的实验室拉来了极为豪华的赞助商阵容,包括英伟达、Meta、蚂蚁集团、AMD、谷歌、亚马逊、华为等知名企业。他还给将自己创业获得的资产投入科研,给实验室提供资金支持。

在向《福布斯》分析自己成功的原因时,Stoica 称,这要归功于他对科研的专注:" 这是一种创造的过程,不断探索新想法。" 在本文中,我们将回顾 Stoica 传奇的创业与科研经历,并了解他对自己成功经历的思考和总结。

一、师从北大计算机校友张晖,06 年首次开启创业

Stoica 于 2000 年在卡耐基梅隆大学(后简称 CMU)完成博士学业,导师是该校史上最年轻的终身教授张晖(北大计算机学院 84 级院友)。

同年,他加入 UCB,并从教至今。UCB 地处硅谷,有极为浓厚的创业氛围,Stoica 也在 2006 年了自己的第一个创业项目—— Conviva。

Conviva 的创始团队(图源:Conviva 官网)

2006 年,流媒体内容逐渐兴起,YouTube 已经成为主流平台之一。Stoica 与他的导师张晖看到了市场对在线视频体验优化的需求,并在 CMU 和 UCB 的科研成果基础之上开始创业,联合创办了 Conviva。

早期,Conviva 专注于实时视频流分析,成为全球最早实现视频播放自适应的平台之一。该公司通过 AI 技术识别视频平台的播放质量问题,并收集用户的观看数据(包括正在观看的内容、用户喜好等),形成分析报告。

Conviva 的主要客户包括美国福克斯公司(FOX)、NBC 环球集团旗下的流媒体平台 Peacock 等。

Stoica 原本在 Conviva 担任 CTO 一职,但目前已经不在 Conviva 拥有正式管理层职位。他仍然留在董事会,每周都会与团队见面。

成立以来,Conviva 已经完成了 7 轮融资,总融资额为 1.1 亿美元。其上一轮融资于 2017 年完成,当时投后估值约为 3 亿美元。

二、给大数据时代打造核心基础设施,成果转化为千亿估值创企

在创办 Conviva 的同时,Stoica 也没有停下学术与科研的脚步。UCB 计算机科学学部有每 5 年成立一个合作实验室的传统,Stoica 深度参与了该学部近 15 年来成立的三大实验室,带领成员做出了颇具学术与行业影响力的成果。

2011 年,UCB 成立了 AMP(算法、机器与人)实验室。在官宣实验室成立的演讲中,Stoica 称,AMP 实验室希望通过紧密集成算法、机器和人力,实现对大数据的理解。

在其存续的 5 年间,AMP 实验室打造了 25 个科研项目,包括开源分布式资源管理框架 Apache Mesos、开源分布式大数据处理框架 Apache Spark、开源分布式数据编排平台 Alluxio(原名 Tachyon)等,成为大数据基础设施领域的重要贡献者。

这三大开源项目,最后都转化为创企:

Databricks(总融资 208 亿美元,估值超 1000 亿美元)

Databricks 是 Stoica 参与创办的第二家创企,主营业务是 AI 数据分析平台。其创始团队由七位加州大学伯克利分校的教授和研究生组成,大都来自 Stoica 所管理的 AMP 实验室。

Databricks 创始团队,Stoica 为左数第二位(图源:Databricks)

2009 年,Databricks 的创始团队开发出开源分布式大数据处理框架 Spark,并不断维护、更新这一项目,还一度创下了数据排序速度的世界纪录。

在将 Spark 作为开源项目运营一段时间后,Databricks 的联合创始人、UCB 副教授的 Matei Zaharia 称,Stoica 希望将 Spark 变成一家初创公司,以鼓励用户更认真地对待此类来自高校实验室的研究。

2013 年,Databricks 正式成立。凭借着开源项目 Spark 的成功,Databricks 在 A 轮融资时便获得来自 a16z 的 1400 万美元融资。2013 年 -2016 年,Stoica 担任 Databricks CEO 一职,深度参与公司日常管理与决策。

他在 2016 年将 CEO 一职交棒给了曾在 AMP 实验室担任访问学者的 Ali Ghodsi。对于这一决定,他在接受《福布斯》采访时说道:" 超过这个时间就意味着离开伯克利,所以我必须做出选择,我选择了回去。"

如今,Databricks 已经成长为估值超过 1000 亿美元的超级独角兽,服务超过 60% 的财富 500 强企业。Stoica 仍在这一公司担任董事会执行主席的职务。

Stoica 担任 Databricks 董事会执行主席(图源:Databricks)

Alluxio(总融资额 7300 万美元,估值暂未披露)

Alluxio 原名 Tachyon,是一个以内存为中心、容错的虚拟分布式存储系统,旨在解决 Apache Spark 生态系统内的数据共享挑战。

2015 年,Alluxio 正式成立,早期投资者为 a16z ——这是一家与 Stoica 关系密切的投资机构。其创始人兼 CEO 李浩源在 AMPLab 完成了相关研究,论文指导者便包括其博士生导师 Stoica。

Alluxio 目前的管理团队,上排左一为李浩源(图源:Alluxio 官网)

随着技术趋势转向混合云和多云架构以及 AI,Alluxio 不断发展,为 AI 和数据密集型工作负载的数据访问提供解决方案。如今,Alluxio 的 AI 加速平台为全球十大互联网公司中的九家提供支持。

Alluxio 已经完成 4 轮融资,其最近一轮融资于 2021 年底完成,由高瓴创投领投,融资额达 5000 万美元。不过,其估值暂时未对外披露。

Mesosphere/D2iQ(总融资 2.5 亿美元,最高估值 7.75 亿美元)

Mesosphere 成立于 2013 年,Stoica 的学生 Benjamin Hindman 在其中担任 CIPO(首席知识产权官)的职务。这家公司的主要技术来自于开源项目 Apache Mesos,而 Benjamin Hindman 是这一项目的核心作者。

DCOS(数据中心操作系统)是 Mesosphere 的核心产品。Mesosphere 将数据中心抽象为 " 单一大机器 ",通过分布式内核调度和资源管理,为大规模计算与数据密集型工作负载提供统一的运行平台。

2015 年,Mesosphere 宣布获得 a16z 等顶级风投的投资。随着容器化、微服务和云原生趋势的兴起,Mesosphere 后续在产品上逐渐转型,支持 Kubernetes,并在 2019 年正式更名为 D2iQ。D2iQ 的解决方案主要面向混合云与企业级 Kubernetes 平台,帮助客户简化云原生应用的部署与运维。

迄今为止,D2iQ 融资总额接近 2.5 亿美元,投资方包括 a16z、Khosla 创投、惠普等,其估值曾经在 2018 年完成的 D 轮融资后达到 7.75 亿美元。微软、谷歌等都曾传出有收购 D2iQ 的意向,但因 D2iQ 管理层反对而未能完成交易。

2023 年底,D2iQ 宣布终止运营,公司资产将进行清盘,并分配给债权人。

三、指导高性能分布式执行框架 Ray 科研,衍生创企估值已达 10 亿美元

2017 年初,Stoica 参与到了 UCB RISE(实时智能安全执行)实验室的创建与管理工作中。当时,Stoica 等人已经意识到,数据生成、计算和执行之间的循环正在闭合,AI 已成现实,计算的影响正在扩展到世界的每一个角落。

RISE 实验室与 AMP 实验室一脉相承,期望能在大数据分析的基础上,进一步发展相关技术栈,帮助应用程序实时地、智能地且安全地与环境进行交互。

在大规模机器学习和强化学习领域,RISE 实验室贡献了超 41 个开源项目,其中影响力最大的当属高性能分布式执行框架 Ray,这一项目成功转化为创企 Anyscale。

Anyscale(总融资 2.59 美元,估值 10 亿美元)

2019 年,Anyscale 成立,创始团队包括 Stoica、Philipp Moritz(Stoica 的博士生)和 Robert Nishihara 等人。Stoica 目前在 Anyscale 担任董事会执行主席的职位。

Philipp Moritz 和 Robert Nishihara 是 Ray 的主要作者,这一项目大幅度提升了分布式计算的易用性,让开发者能够用简单的 API,把单机 Python 程序扩展到大规模分布式环境。Stoica 指导这两位作者完成了 Ray 的相关研究。

Stocia 与 Anyscale 其他联合创始人的合影(图源:Anyscale 官网)

Ray 提供了统一的编程方式,开发者不必关心底层分布式细节。相比于传统的 Spark、Hadoop,Ray 更灵活,支持低延迟的任务调度和多种计算模式(批处理、流式、在线推理等)。

这一项目在 AI/ML 领域影响力尤其大,业内许多流行的库都是基于 Ray 构建的,如 Ray Tune 超参数调优框架、Ray RLlib 强化学习库等。

在此基础上,Anyscale 为 Ray 提供了完全托管计算平台,添加了优化、可观察性、数据治理和开发人员工具等,使其成为运行 Ray 工作负载的最佳平台之一。

目前,Uber、OpenAI、Shopify 和亚马逊等头部企业的开发人员正在使用 Ray 构建机器学习平台。Anyscale 成立 6 年来共完成 4 轮融资,总融资额达 2.59 亿美元。2022 年完成 C 轮融资后,其最新估值为 10 亿美元。

四、实验室 3 年贡献 52 个项目,帮大模型造擂台、记忆库

2022 年,Stoica 又推动了天空计算实验室(Sky Computing Lab)的成立。天空计算是云平台之上的一层,其目标是实现云之间的相互协作,让应用程序能够在任何云提供商上实现 " 一次写入,随处运行 "。

天空计算实验室近年来已经贡献了 52 个项目,打造了本轮生成式 AI 浪潮中重要的基础设施,包括大模型推理引擎 vLLM、AI 作业框架 SkiPilot、大模型评估平台 Chatbot Arena(现名 LMArena)、视频生成模型评估平台 Video Arena、智能体记忆系统 MemGPT 等,其中,LMArena 和 MemGPT 已经实现公司化运作。

LMArena(总融资 1 亿美元,估值 6 亿美元)

LMArena 由 Stoica 和他的学生 Wei-Lin Chiang、Anastasasios N. Angelopoulos 等人联合创办,Stoica 担任 LMArena 的董事长。

这一平台通过 " 人类偏好投票 " 方式,公开评估大语言模型性能。当用户在这一平台上提交提示词后,会有两个匿名模型作答,然后基于用户选择判断哪个模型表现更佳。LMArena 的数据与排行榜广受业界关注,甚至成为不少模型发布前的重要参考。

目前,LMArena 托管了 400 多个 AI 模型,平台用户投票数达到 350 多万张。今年年初,LMArena 完成 1 亿美元的种子轮融资,领投机构为 a16z,投后估值达 6 亿美元。

融资完成后,LMArena 团队发布了全新设计的平台,优化了界面和投票流程,并逐步加入登录、聊天记录保存、WebDev Arena 等功能模块。

Letta(总融资 1000 万美元,估值 7000 万美元)

Letta 成立于 2024 年,由天空计算实验室的两位博士生 Sarah Wooders 和 Charles Packer 创办。其中,Stoica 是 Sarah Wooders 的博士生导师,并在该公司担任顾问。

Letta 创始团队(图源:Letta)

Letta 的核心技术源自 MemGPT,后者是天空计算实验室的一个开源项目。MemGPT 提出了 " 大模型操作系统 " 的概念,专注于大模型的上下文管理和长期记忆能力,让大模型变得 " 有状态 "(Stateful)。

2023 年 10 月,MemGPT 项目在正式发布论文和代码之前,就凭借一份白皮书迅速走红。该项目正式发布在 GitHub 上后,已经收获 1.8 万星标收藏,有近 2000 个分支项目。

Letta 目前的主要产品包括 Letta 云(打造和部署有状态 Agent 的云平台)和用于增强 Agent 处理外部文件能力的 Letta 文件系统。

2024 年 9 月,Letta 获得 1000 万美元种子轮融资,估值达 7000 万美元。

五、靠拉赞助和创业反哺科研,80 多名学生从中受益

Stoica 过去 15 年内主持工作的三所实验室,拥有不少共同的特点:开源、前沿、与产业密切结合。这些特点让它们不止停留在学术机构的层面,还拥有孵化器般的能力。

自 2011 年的 AMP 实验室以来,Stoica 就特别注重与产业界的密切合作。AMP 实验室拉来了谷歌、SAP、亚马逊、华为、IBM、英特尔、微软、VMWare 等企业作为赞助商。

此后,Stoica 的实验室还获得了英伟达、Meta、蚂蚁集团、AMD、博通、三星、Lambda 等企业的支持。

同时,通过不断创业,Stoica 的创业项目还使他成为了亿万富翁,现资产大约有 25 亿美元,他将一部分个人资产投入实验室的运营工作中。

这些真金白银的支持让 Stoica 的实验室拥有资金和资源,得以同时开展大量研究项目。

目前,Stoica 在 UCB 担任研究资金削减问题工作组的主席。他鼓励其他教授向他一样通过创业获取资金,在美国政府削减科研资助的大背景下继续科研。

但成为亿万富翁并非 Stoica 的目标。Stoica 在接受《福布斯》采访时称:" 我仍然是一名学者,如果赚钱是唯一的驱动力,那我就去 IPO 了。这是最简单的方法,但我不是出于这一目的而创业,我想创造有意义的东西。"

他还认为,自己在创业中获得的成功,得益于对科研的专注:" 这是一种创造的过程,不断探索新想法。" 此外,大学的科研项目大多具有开源性质,能吸引企业使用,而大部分公司不会开源最佳系统。基于开源项目打造的企业,在起步阶段就能获得不少声量。

将 Stoica 留在学术界的原因,可能是他的学生们。他向《福布斯》说道:" 这些处在成长期的年轻人不知道什么做的成,什么做不成,但他们有信念,能做出让人出乎意料的解决方案。"

由 Stoica 亲自指导的 80 多名学生从他的资源和关系网中受益,他们绝大多数都在学术界、大公司就职,或是拥有自己的初创公司,其中包括在 Databricks 工作的至少 7 名学生。

结语:高校前沿探索仍有望转化为巨大商业价值

当今的 AI 浪潮中,有越来越多颇具影响力的成果,诞生在产业界,这也让外界一度怀疑:在计算资源要求越来越高、规模效应越来越强烈的 AI 领域,学术界的价值何在?

而 Stoica 教授的成功经历证明,在高校进行的开源、前沿探索项目,往往能对产业界起到极为重要的补充和启发性作用。在以适当的方式转化为企业后,仍然可以贡献巨大的产业和商业价值。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

ai 创始人 科研 基础设施
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论