远川研究所 08-29
AI云,重画的起跑线
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

AI 与云计算,正在以前所未有的紧密姿态绑定在一起。

2024 年,中国新增千亿级别参数大模型 50 个,推动智能算力规模同比增长 74.1%,是通用算力同期增幅的三倍以上,智算中心利用率持续突破 70% [ 1 ] 。

云计算是 AI 规模化落地的基石,AI 则彻底改变了云服务的架构与价值逻辑,催生了 "AI 云 " 这一新范式,使得云计算产业突破长期桎梏,跑出了增长的第二曲线。

正如百度集团执行副总裁、百度智能云事业群总裁沈抖说,当价值的创造方式被重构,产业链也会进化,AI 就会进入真正的 " 超级周期 "。

随着产业进入应用规模化落地期,从 " 知识增强 " 走向 " 执行增强 ",对 AI 云的需求也从底层的 AI 算力基础设施走向了更全面的一站式端到端解决方案,给云厂商提出了新的挑战。

AI 与云计算的共生关系重构技术与商业的边界,正在画出全新的起跑线,云计算固化已久的竞争格局也开始松动。

AI重塑云计算赛道

2020 年 5 月,微软用 28.5 万颗 CPU 和 1 万颗 GPU,在 Azure 云平台为 OpenAI 构建了第一台 AI 超级计算机,为两年后的 "ChatGPT 时刻 " 按下了倒计时。

奥特曼(左)和纳德拉(右)

奥特曼将这次合作称为 " 科技界最佳基友情 ",而对当时的云计算产业来说,更大的意义在于将产业从 " 同质化 - 价格战 " 的水深火热中拯救出来,获得新赛道的入场券。

这一年,中国云计算市场规模高增 33.6% 达到 1781 亿元人民币 [ 2 ] ,是全球增长最快的地区之一。但在数据高光的背后,是惨烈的价格战厮杀以及挣脱不开的同质化困局。

云计算的本质是算力资源的池化和再分配,传统云计算作为 " 新基建 " 之一,扮演的角色类似于供水厂、供电厂,是算力的搬运工,算力也如同水电被标准化,导致差异化困难,价格便成为了竞争唯一的铆。

海外巨头以亚马逊 AWS 为代表率先开战,宣布对计算实例 Amazon EC2 和存储服务 Amazon S3 等多项云计算核心业务降价,最高降幅达到 40%,微软 Azure 和谷歌云迅速跟进,最高降幅分别超过 50% 和 60%。

AWS 当时的一则降价公告

战场蔓延至正值高速增长期的中国,战况更是惨烈,围绕政企大单和互联网增量市场,从单纯的资源降价进阶至战略性亏损抢占,招标项目 " 地板价 " 频现,一线巨头以利润的暴跌为代价守阵,二线厂商徘徊生死边缘。

与提供标准化算力资源的公有云相比,以私有云为代表的定制化解决方案路线,被认为是云计算摆脱同质化陷阱的良方,但在战火纷飞的 2020 年,却也深陷碎片化瓶颈。

定制化是通用性的反面,导致需求的 " 非标性 ",不同行业、不同规模的客户对云计算的理解和自身技术能力差异巨大,需求天差地别,需要厂商 " 上可摘星辰,下可捞月亮 "。

客户需求拳拳到肉,对应的是居高不下的成本和人力投入,坐办公室的工程师沦为科技施工队,

微软与OpenAI的 "AI+云计算 " 联姻,为乌云密布的云计算产业打开了一扇窗。

一方面,AI 模型训练依赖云计算超大规模计算能力,打开了市场空间,另一方面,AI 技术融入云计算带来技术的革新,衍生新的应用场景,同时提高了底层计算方案的通用性,在同质化和碎片化之间取得了平衡。

简单来说,就是将竞争的焦点从 " 我的计算力有多便宜 " 转移到 " 我能为你解决什么业务难题 " 上,从简单粗暴的资源规模竞争,全面升级为创新解决方案的竞争。

当 "AI云 " 成为冲破雾霭的第一束阳光,只有少数人意识到了,其中就包括百度智能云

人工智能时代的技术栈分为四层:芯片层、框架层、模型层和应用层。

百度是最早投身 AI 的中国公司之一,AI 向来是其长坡厚雪的赛道。

2016 年,百度发布并开源了中国自主研发的第一个深度学习框架 " 飞桨 ";2018 年,云端全功能 AI 芯片 " 百度昆仑 " 在百度 AI 开发者大会首发;2019 年,百度开始预训练大模型的研发,为后来发布的文心大模型奠定了基础。

截至 2020 年底,百度已经事实上拥有了从底层硬件到上层应用的完整 AI 技术栈,这是当时所有云计算竞争对手都不具备的完整生态。

这一年,百度智能云业内首倡 " 云智一体 " 的发展策略,以全栈布局优势率先启动了 AI 开发范式的变革,带领中国云计算产业向新的模式演进。

" 大力 " 出不了奇迹

8 月初,知名调研机构 Gartner 的报告称,全球对 AI 基础设施持续加码投资,与此同时,企业内部的新项目却陷入 " 不确定性暂停(Uncertainty Pause)" [ 3 ] ,新技术上线节奏明显放缓。

根据网站 AI Graveyard(AI 墓地)统计数据,截至目前,网站收录的 4845 个 AI 项目中,已有 1351 个被关闭、被收购或停止运营,其中有 277 个项目是在过去的 7 个月内 " 死亡 " 的,平均每天都有一家 AI 初创公司倒下。

"AI 墓地 " 网站

应用落地能力与基础设施投资规模的背离,证明了大模型时代云计算商业逻辑的彻底改变。

过去以 " 规模化降本 " 为主要打法,大兴土木、越亏越投,如今虽然同样强调底层硬件设施的投资,但对整体系统和解决方案的调优能力也被前所未有的前置了。

一方面,相较于传统云计算任务,AI 训练和推理对算力消耗巨大,特斯拉当年的 dojo 集群运行在 1 万颗 GPU 上,建造成本 3 亿美元起步,因此需要从芯片层、硬件层、框架与模型层等多个维度调优,以实现更高的计算效率和更低的成本。

另一方面,AI 大模型是极其复杂的系统工程,涉及数据处理、模型训练、调试、部署等漫长链路,并非像过去一样 " 大力就能出奇迹 ",要想提高方案落地效率,需要云计算厂商能够提供 " 端到端 " 的调优能力,以降低客户的应用门槛。

带着 AI 的深深烙印,百度在入局云计算之初就明确了 " 人工智能、大数据与云计算 " 三位一体的发展策略,到了 " 云智一体 " 的时代,升级为 " 算力 - 模型 - 应用各层架构 " 的端到端优化能力。

百度智能云提供三个层面的服务,覆盖了大模型的整个生命流程:

第一层是基础设施层(AI IaaS),负责 " 算 ",核心部分包括百度自研的 AI 芯片昆仑芯,今年 4 月实现了国内首个三万卡集群的规模化部署,能够同时承载多个千亿参数大模型的全量训练,支持 1000 个客户同时做百亿参数的大模型精调。

百度百舸(Baige)AI 异构计算平台,则负责高效调度和优化异构算力,通过 AI 大引擎能力大幅提升 AI 任务效率,例如可以将自动驾驶模型的迭代周期从 " 月级 " 缩短至 " 周级 "。

第二层是平台服务层(AI PaaS),负责 " 智 ",千帆平台将模型服务、Agent 编排、数据和企业级服务等多种服务模式打包,类似于一个企业级大模型开发与应用的 " 超级工厂 ",也是 " 云智一体 " 战略的核心载体。

第三层则是应用与解决方案层(AI SaaS/Solution),百度智能云也在千帆和百舸上,开发了一些开箱即用的 Agents,直接面向各行各业的具体场景,包括一见视觉大模型平台,数字员工等等。

通过建立一个全栈式、端到端的产品体系,百度智能云的目标不只是解决算力优化、行业落地等固有困境,更是要打造一个活跃的生态,给崭新的业态提供新的解题角度。

长期主义者的胜利

AI 大模型冗长的产业链和对算力的惊人需求,进一步提高了 AI 云的准入门槛,也要求厂商明确自身长板,形成更具竞争力的商业模式,让投资掷地有声。

放眼当下各家云计算巨头的布局,有重金砸向基础设施、凭借优势业务资源构建商业闭环的,也有强调用户需求和产品体验,靠工程能力和 B/C 端连接能力抢占市场的。

与同行们相比,百度智能云更像是一个 " 技术专家 " ,以 "AI带动云 " 作为核心驱动力,以全栈自研的 AI 能力吸引客户上云,与 "AI 原生 " 的行业大势呈现了高度的一致性。

根据 IDC 最新发布的报告,2024 年,百度智能云以 24.6% 的市场份额连续六年、累计十次蝉联中国 AI 公有云市场份额第一。作为云计算赛道的后来者,百度智能云正是依靠 AI 技术的积累以及 " 云智一体 " 战略引领下的错位竞争,实现了一次完美的换道超车。

在刚刚召开的 2025 百度云智大会上,沈抖宣布,百度智能云 " 云智一体 " 战略进一步升级:

将打造云智一体、智能优先的新一代 AI 云基础设施,一切以智能为核心,致力于提升智能的天花板、扩大智能的渗透面,成为中国 AI 引领世界、造福人类的坚实底座。

基于这一全新战略,百度智能云的智能基础设施和平台服务迎来了再次迭代。

其中,百度百舸 AI 计算平台迭代至 5.0,主要针对推理能力进行了全面升级。数据显示,当前推理算力在云端算力中的占比已达到 58.5% [ 4 ] ,对应 AI 大模型应用进入密集落地期,百舸升级以应时需。

据沈抖介绍,当前 AI 计算的瓶颈主要体现在网络、算力、推理系统,以及训推一体的整体计算效率,而百舸 5.0 正是在这四个维度上实现了性能的跃升,其中最大亮点之一在于昆仑芯超节点实例在百舸上正式可用。

昆仑芯超节点是将 64 张卡放进同一个机柜,超节点用卡间互联代替机间互联,实现单卡性能提升 13 倍,单卡吞吐提升近一倍,较国内同类产品至少高出 15%,单机训练性能提升 10 倍。

这意味着使用搭载了昆仑芯的百度智能云,只需要花费几分钟、一个云实例,就可以轻松运行一个参数 1 万亿的开源模型。

在此基础上,为了进一步压榨算力资源,提升训练、推理效率,百舸还发布了强化学习框架 BRL,将训练和推理两个独立环节打造成一条 " 推理采样、奖励评估、训练更新 " 的流水线,将单点吞吐推到极限,相较于原先的开源框架效率提升 9 倍。

与此同时,百度智能云千帆平台也迎来了 4.0 时代,打造为 Agent 为核心的一站式企业级服务平台。

AI Agent 本质是一个能感知、会决策、可执行的智能体,被 Gartner 列为 2025 年十大技术之首,并预测到 2028 年,33% 的企业软件应用程序将包含代理式人工智能 ( Agentic AI ) ,至少 15% 的日常工作决策将通过 Agent 自主做出。

百度智能云千帆 4.0 为开发者提供了 Agent 开发所需要的模型、Agent 编排、数据和企业级服务等能力,最终目的是为了打造一个能够支撑 Agent 开发和创新的系统化基础设施,打造一个高效的 AI 能力工厂,降低 Agent 的开发门槛,加速应用落地。

在围绕 Agent 补充工具链的同时,千帆 4.0 还将模型库扩充至 150 个,其中千帆自研行业专精模型库再次升级,带来更好的效果、更低的成本和更强的性能。

例如,千帆慧金金融行业模型,在金融行业的认证考试、推理计算等公开评估集上普遍超过了 SOTA 的通用模型;千帆 VL 视觉理解模型则在 20 多个开源评估集上效果领先。

在此基础上,百度智能云还推出了 " 开箱即用的 " 数字员工 "AI 吴彦祖 "、一见 SOP 合规分析能力,为 Agentic AI 在客服、营销场景和专业级视觉 AI 应用的实践提供了业内范本。

伴随着百度智能云的迭代升级,其解决方案应用领域不断扩大,从传统的金融、冶金行业到人形机器人、自动驾驶、3D 创作、AI 眼镜等众多创新赛道,为百度在未来想象与不确定性并存的科技竞争中占下身位。

根据百度今年第二季度财报,百度智能云收入同比增长 27%,推动百度 AI 新业务首次突破 100 亿元,同比增长 34%。百度创始人李彦宏对此表示," 第二季度,智能云业务实现健康增长,这得益于我们不断加强的全栈 AI 能力和端到端 AI 产品及解决方案。"

在 2025 百度云智大会演讲的尾声,沈抖表示,每一代基础设施的使命,都是激发新产业、创造新增长。

这让人想起年初李彦宏在世界政府峰会的发言," 人们无法确切知道创新何时何地会出现,所能做的就是营造一个有利于创新的环境 [ 5 ] 。"

而这,也是百度智能云云从过去到现在一直在做的事。

热火朝天的 AI 云投资背后,是无数行业专家的警告:

目前对 AI 大模型的投资仍处于早期阶段,短期内难以带来显著营收,这代表云计算竞争的根本属性并没有因为 AI 大模型的到来真正改变。

它注定不是一场属于投机者的狂欢,终将是一场长期主义者的胜利。

而百度智能云正在领跑。

参考资料

[ 1 ]   中国智算云行业市场现状分析及发展潜力研判报告,智研咨询

[ 2 ]   中国互联网发展报告(2021),中国互联网协会

[ 3 ]   Forecast Alert: The Uncertainty Pause Dominates Enterprise IT Spending, 2Q25, Gartner

[ 4 ]   2025 云计算十大关键词,中国信通院

[ 5 ]   李彦宏在世界政府峰会上谈创新:无法预知创新何时何地出现,环球网

作者:何律衡

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

ai 云计算 微软 起跑线 云计算产业
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论