钛媒体 09-08
中小企业如何突破AI算力“高墙”?
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

前不久,国务院发布《关于深入实施 " 人工智能 +" 行动的意见》(以下简称《意见》)从重点行动领域、基础要素支撑、组织实施等方面,针对实施 " 人工智能 +" 行动进行了全面部署。《意见》的出台预示着接下来 AI 将成为接下来各行业重点发展的数字技术之一。

从市场角度出发,截至 2025 年 6 月底,我国已发布 1509 个大模型,占全球已发布 3755 个大模型首位。但相比以大模型为代表的 AI 技术的繁荣,AI 算力确面临诸多瓶颈,比如,高端算力供给不足、国产加速卡性能差距大、算力成本高、自主软硬件生态不成熟等严峻问题。

中小企业遇见 " 算力高墙 "

全球科技浪潮里,AI 产业正以惊人的速度裂变生长,从技术突破到广泛落地,逐渐形成了规模庞大、场景丰富的产业生态。

然而,在 " 百模大战 " 的喧嚣与科技巨头算力竞赛的阴影下,是一个被日益高耸的 " 算力高墙 " 围困的群体—— AI 产业中的中小企业。它们犹如产业生态中的 " 毛细血管 ",尽管体量不大,却承载着最具活力和多样性的创新基因。

与此同时,各行业的发展除了离不开头部企业的引领之外,中小企业在行业中托起基层市场的力量不可忽视。工业和信息化部数据显示,我国中小企业贡献 50% 以上税收、60% 以上 GDP、70% 以上技术创新成果。

相较于组织结构复杂、决策链较长的大型企业,中小企业机制灵活、反应迅速,能够将资源集中投入特定细分领域,实现快速技术突破与产品迭代,进而获得更强的创新能力。

而这些最具创新活力的主体,却最易受到外部环境的冲击。当前不断攀升的算力成本,成为了悬在 AI 中小企业头顶的 " 达摩克利斯之剑 "。

以中小型 AI 企业为例,目前困扰这些企业最大的一个难题就是——硬件采购成本,2023 年 9 月,香港科技大学(广州)公开定向采购公告显示,一套搭载 H800 GPU 的英伟达 DGX SuperPOD 配套软硬件及服务项目,中标金额为 2.592 亿元人民币。

退而求其次的 " 租赁模式 " 同样困境重重。由于无法自建算力集群,多数 AI 中小企业只能依赖第三方 GPU 租赁服务,但这不仅要承受每卡每月数万元的高昂费用,还面临资源调度不稳定、利用效率低等问题。

硬件采购之外,更严峻的是,算力竞争已演变为资本主导的 " 游戏 "。斯坦福大学《2024 年人工智能指数报告》指出,仅 GPT-4 的训练成本就达到 7800 万美元。这意味着,即便中小企业在算法设计上具备优势,也可能因无法承担高昂的算力成本,被挡在技术竞争的起跑线之外。

曾有某中小型行业模型企业相关负责人告诉笔者,公司近 60% 的研发资金用于算力租赁," 每一次算法迭代都是‘烧钱试错’,一旦研发周期超出预期,资金链断裂的风险就会急剧上升。" 该名负责人指出。

这种 " 算力依赖型 " 的生存模式,让中小企业陷入 " 创新投入越高,生存压力越大 " 的恶性循环。

与此同时,中科曙光高级副总裁李斌表示,当前,封闭式的模型训练和部署,都已经从原先的单芯片算力需求,转变为紧耦合的算力集群系统,且系统复杂度越来越高," 另一方面,从产业链角度出发,底层算力芯片到上层行业应用之间的链条很长,在进行跨层软硬件协同优化方面,也有着不小的挑战。" 李斌指出。

无独有偶,中科曙光总裁助理、智能计算产品事业部总经理杜夏威也指出,随着大模型技术的发展,企业对于算力的需求也在发生着变化。首当其冲的就是,以 MoE 为代表的模型技术应用快速成熟,传统以单机、单卡的算力需求,转向了多卡协同的集群化需求。

在此基础上,软硬耦合也催生了应用层面的深度整合," 如今,我们再谈论大模型私有化,以及行业模型之时,不再仅限于大模型的简单应用,而是更多的开始向模型算法、算力私有化,以及数据私有化下沉," 杜夏威进一步指出," 归根结底,所有问题都表明了一个诉求——如何构建一个契合企业自身行业诉求,与行业需求深度定制的大模型,以及算力设备支撑。"

打造 AI 算力版 " 安卓 "

面对如此复杂的挑战,李斌认为," 国内的智算产业,就像智能手机圈一样,不仅需要苹果这类大企业,还需要安卓式的生态创新模式。"

不过李斌表示,当前国内 AI 算力产业的 " 安卓 " 生态仍处于 " 准备阶段 ",他指出,过去通算时代,整个 IT 产业分工明确,相对而言,技术架构演变比较慢," 那个阶段,做芯片、做系统、做中间件、做软件,都可以在自己的框架里,各自优化,最后放在一起就可以了。" 李斌进一步指出," 那时候,对跨界、跨层协同需求并不强烈。"

当进入智算时代,这一切发生了改变,李斌将改变总结为三点:第一是系统复杂度提升;第二是产业链边长;第三是技术融合变多," 这种时候就需要类似安卓的模式,需要企业报团取暖,而不是各自为战。" 李斌强调。

在前不久结束的 2025 世界智能产业博览会上,中科曙光协同 AI 芯片、AI 整机、大模型等 20 多家产业链上下游企业,共同发布国内首个 AI 计算开放架构。谈及发布 AI 计算开放架构的原因之时,李斌表示,我们希望打造一个类似 " 安卓 " 的生态,借由此,促进跨层软硬件协同,并让产业链上下游协同更加顺滑。

据悉,该架构是面向大规模智能计算场景,以 GPU 为核心进行高效紧耦合系统设计的协同创新体系,旨在从 " 算、存、网、电、冷、管、软 " 单点突破走向集群创新。此外,该开放架构支持多品牌加速卡并兼容主流 AI 软件生态,既避免用户被单一技术 AI 路线绑定,也显著降低了硬件采购与 AI 软件开发适配成本。

基于 AI 计算开放架构设计,在本届智博会上中科曙光还发布了曙光 AI 超集群系统,对此,杜夏威介绍道,曙光 AI 超集群系统拥有 " 超高性能、超高效率、超高可靠、全面开放 " 四大特征,可为万亿参数大模型训练推理、行业大模型微调、高通量推理、多模态大模型开发、AI4S 等场景打造更大更高效算力底座。

面相未来,只有当算力资源真正实现 " 普惠化 ",当产业生态形成 " 开放包容、安全可信、充满活力 " 的格局,中国 AI 产业才能突破 " 算力高墙 " 的禁锢,让中小企业的创新活力充分释放。这不仅是把握新一轮科技革命主动权的关键,更是为实现高水平科技自立自强、推动高质量发展注入的强劲动力。

(本文首发于钛媒体 APP,作者|张申宇,编辑丨盖虹达)

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

ai 中小企业 人工智能 gpu 斯坦福大学
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论