中国企业家杂志 08-27
离开王慧文的两年,这位创业者赶上了梁文锋的头班车
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

焦虑,是 AI 创业的必修课。

AI 创业风起云涌,过去两年,创业者袁进辉经历了两段奇幻历程。

第一段是 2023 年 3 月,美团联合创始人王慧文收购袁进辉的第一个创业项目 OneFlow。OneFlow 是一个深度学习框架,它可以加速大模型训练效率。王慧文看中了袁进辉的技术能力。

由此,袁进辉和团队并入王慧文创立的光年之外,2023 年 6 月,王慧文宣布 " 病退 ",老朋友王兴出手接盘,光年之外被美团收购,袁进辉随之进入美团体系。

第二段是 2023 年 8 月,袁进辉决定出走美团,再次创业,成立硅基流动。他瞄准 AI Infra 创业,这是一个芯片之上,大模型和应用之下的中间层,可通过技术手段实现模型的稳定高效调用。

今年 1 月 20 日,DeepSeek 发布并开源 R1 推理模型,迅速爆火。2 月,袁进辉带领团队加班加点,春节不休,硅基流动联合华为云部署 R1 模型,这让硅基流动官网的流量暴涨 40 倍,一度超过腾讯云与阿里云。

袁进辉和 DeepSeek 创始人梁文锋还另有一段渊源。

从美团出走之后,袁进辉到处找融资,此时,梁文锋流露出 " 有意愿投资 " 的想法,但两人在开不开源的问题上有分歧,梁文锋坚持模型推理部署引擎要开源,不开源没出路,但袁进辉还没有从上一段创业经历 OneFlow 中走出来——因商业化不足,该项目数次陷入资金周转困境。

" 我们之前做开源深度学习框架 OneFlow,开源不见得有助于成功,要想清楚商业逻辑才行。" 袁进辉告诉《中国企业家》。

所以,投资没有了下文,但两家公司一直在业务上有交集,DeepSeek 数次更新大模型时,袁进辉团队都会率先将其部署在硅基流动的服务器上,包括 2024 年 5 月发布的 V2 模型以及 9 月发布的 V2.5,在一段时间内,硅基流动是唯一部署 DeepSeek-V2 和 V2.5 的第三方服务商。

从 2016 年开启第一段创业,再到 2023 年第二段创业,袁进辉总结创业这件事:" 现在创业就像穿越沙漠,身上背一些补给水,中间没找到绿洲,也许水就喝完了,穿越不过去。但现在,我们找到了一块绿洲,如果绿洲足够大,我就住在这儿了,也可能在这儿补给之后,继续往前走。"

补给就是拿投资人的钱,绿洲就是 DeepSeek 爆火带来的商业化机会,使硅基流动有现金流与不断增长的业务。

硅基流动最新一轮融资完成于今年 6 月,由阿里云领投,金额达数亿元人民币,老股东创新工场等机构超额跟投,早前的投资机构还有美团(战略投资)、耀途资本、奇绩创坛等。

这是一个连续创业者在 AI 时代的节奏,在技术快速迭代下,没有什么壁垒是永恒的,只能伴随技术进化,直至找到沙漠中那片足够大的绿洲。

大规模专家并行之战

2024 年 12 月,DeepSeek 发布 V3 模型之前,梁文锋问袁进辉的团队,要不要先部署,结果算了一下账,袁进辉发现,可能没那么多钱(租服务器),当时大家还开玩笑,赶紧融资,让投资人打钱。

部署 V3 模型的难点有两个。第一,最优的部署结构是要用大规模专家并行,如果不用专家并行,生产效率很低,也很难算过来账。要复现大规模专家并行,需要投入大量研发工作量。

第二,要做大规模专家并行部署,需要大几十张卡或者几百张卡,一个月租赁费用就要七八万元,如果要租几十台服务器,对创业公司而言是一笔不小的成本支出。

等到 2025 年 1 月,基于 V3 模型架构的 R1 模型推出,它引发的流量风暴让 DeepSeek 的 APP 和网页端直接崩溃,一天只能回答用户一个问题。第一周,DeepSeek APP 的下载数量为 600 万次,到了第二周,数量已经飙升至 2000 万次,它的爆火叠加春节的人员流动,DeepSeek 成了街谈巷议的话题。

来源:AI 生成

彼时恰逢春节,袁进辉不得不动员整个团队,春节不停工,周末技术团队也加班加点,这种状况一直持续到 4 月。除了 DeepSeek 官方,没有哪一家在短时间突破大规模专家并行技术,大家只能" 开着飞机换引擎 ",先用堆砌资源的方式接入流量,然后更新推理引擎架构,逐渐替换旧有的架构,这个过程大概持续了两个月。

接住了流量红利,这让硅基流动在 2 月声名鹊起,它一夜之间变成了一款 C 端应用。C 端小白用户以尝鲜为主,但留存不佳,当大厂的 C 端产品后来部署了 DeepSeek,他们就会转移至大公司的产品里,比如腾讯元宝,第一季度,月活跃用户数从数百万飙升至 4000 万。

这场流量迁徙大战打出了硅基流动的 " 品牌知名度 ",在一些 AI 厂商的 API 调用窗口里,除了腾讯云、火山引擎、阿里云之外," 硅基流动 " 也是一个选项。

回顾这场瞬时爆发的大战,可以说,袁进辉有一些收获:第一,跑通了大规模专家并行,让其从 " 可用 " 变成 " 好用 ";第二,打了大仗,打开了市场,锻炼了团队,增加了品牌知名度。

大模型时代的商业化

MaaS(模型即服务)是大模型时代诞生的商业模式,对于用户来说,用多少 Token,花多少钱。但一些创业者对这一模式持相反态度。

袁进辉告诉《中国企业家》,MaaS 服务能不能赚到钱,取决于企业有没有这个能力,比如在技术方面,用同样的算力,发挥出更好效率。

在 4 月实现大规模专家并行之后,它的 Token 输出效率是非专家并行的几十倍,是存在赚钱空间的。

为解决外部公司部署难题,DeepSeek 专门举办了 " 开源周 " 并发布了相关论文,DeepSeek 提到,"V3/R1 推理系统的优化目标是:更大的吞吐,更低的延迟。为了实现这两个目标,我们的方案是使用大规模跨节点专家并行。"

袁进辉举例,假设我有 40 台机器,一个月的租金是三四百万元,跑满的话,一个月生产的 Token 大概能有过千万的收入。袁进辉说," 关键是跑满。" 这涉及获客、机器错峰运行等运营效率问题。

袁进辉说:" 作为供应商,是否能做好 MaaS,取决于是否能驾驭这一系统工程。对于做 Infra 的公司,本职工作就是解决用户痛点或行业困难。"

所以,当一些初创公司放弃部署 DeepSeek 提供 MaaS 服务时,袁进辉抓住了这个机会。

为了吸引用户,硅基流动早在 MaaS 平台推出后不久就上线了 " 注册送 14 元,邀请成功送 14 元 " 的运营策略。袁进辉开玩笑说,这次爆火差点让自己的现金流撑不住。

但袁进辉不后悔,他表示,做任何决策都是有风险的," 如果不赌,你只能等下一次机会,至少在这次机会里,没资格参与了,你只能去做软件销售或者一体机这样的项目。其实没有人不想做最好的生意,最好的生意就是 AI 云服务。"

袁进辉说:" 创业期间,你应该担心的,不是问题太挑战而是没有挑战,老是碰到一些容易的问题,这是没意义的。"

2025 年,袁进辉认为,整个 AI 行业都要考虑的关键问题是商业化。

他说:" 原来大家关心的全是技术问题,但现在,整个行业思考的是要做什么产品,产品怎么完成商业闭环。"

AI 时代的创业—— " 焦虑 "

对于硅基流动来说,2025 年的关键词是高增长。

袁进辉说:" 我们怎么提高市场占有率,不管是中小 B 客户也好,还是大 B 也好,不管是公有云也好,私有部署也好,甚至也可以做海外市场,把它转化成绿洲。"

穿越 " 沙漠 ",除了随身携带的补给,必须不断寻找绿洲。

袁进辉说,创业过程可能不是一步到位。字节跳动也不是第一步就做了抖音,它在中间有几个跃迁曲线," 抓住现有的商机,标准化产品,尽可能提高市场占有率,变成一个未来对抗风险的安全港,你才能在未来抓住更好的机会,做出更好的产品。"

做 AI Infra 创业,其本质是寻找大公司之间的缝隙,在密集的炮火之间寻找沟壑,但它的产品保鲜期也比纯 C 端产品要长一些,壁垒更厚一些。

硅基流动的一大优势是 " 中立 ",相对于模型厂商,后者推广大模型云服务,优先卖自己的模型。

袁进辉说,现在 AI 还处在野蛮生长阶段,大公司的大炮射程也覆盖不了所有地方,这时最关键的是不要想那么多,舍命狂奔就好了。

就像模型能力有天花板一样,AI Infra 技术也有它的天花板,它注定无法持续领先竞争对手很多,但关键是做好细节优化、工程聚焦。

" 焦虑感是现阶段 AI 公司的特点,各领风骚一段时间,你还不能停。"袁进辉总结。

重开一局,袁进辉想再次挑战自己。" 从刺激程度来说,不仅要把技术做好,也要把产品、商业做好。就像打游戏一样,一关一关地过,如果老是重复打同一关,你很快就烦了,没什么兴趣了。"

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

王慧 美团 开源 ai 创业者
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论